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the potential resources having the highest potential-resource relevance scores. 

qq (57) Abrege : Un procSdS pour determiner des ressources additionnelles pertinentes par rapport a un ensemble donn6 de ressources 
^ de depart comprend les Stapes suivantes : a) identifier un ensemble de ressources citantes constituees par toutes les ressources ay ant 
un lien vers au moins Tune des ressources de depart, b) former un ensemble de ressources candidates constitue par T ensemble des 
f^T ressources citees par les ressources citantes, c) pour chaque ressource candidate, calculer un score de pertinence de ressource candi- 
J£ date entre ladite ressource candidate et V ensemble de ressources de depart sur la base de l'existence de liens situes dans les ressources 
citantes et diriges vers la ressource candidate et vers les ressources de depart, et sur la base egalement de scores de pertinence de 
ressources citantes affectes a chacune des ressources citantes, d) pour chaque ressource citante, recalculer un score de pertinence de 
ressource citante sur la base de Texistance, dans la ressource citante en question, de liens vers les ressources candidates et sur la base 
egalement des scores de pertinence de ressource candidate attribuees aux ressources candidates a Felape c), e) repeater le cas echgant 
^ l'elape c) et le cas echeant une ou plusieurs fois T6tape d) puis T6tape c), 0 determiner lesdites ressources additionnelles pertinentes 
^* comme etant les ressources candidates qui presentent les meilleurs scores de pertinence de ressource candidate. 
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« Proc6des et systemes de recherche et d'association de ressources d'information telles que des 
pages Web » 

La pr6sente invention concerne d'une fa9on g6n6rale des procedes et systemes de gestion de 
5 ressources telles que des pages Web accessibles par V Internet, ou tous autres types de 
documents, visant d'une part a am£liorer l'obtention de ressources « proches » de ressources 
donn6es, en termes notamment de centres d'int^rets pour l'utilisateur, et visant d'autre part a 
permettre a l'utilisateur, d'une maniere particuli&rement simple et intuitive, d'effectuer lui-meme 
des associations entre ressources, notamment pour en tirer parti lors de l'obtention de ressources 
10 proches. 

L'&at de la technique 

La quantite d'information potentiellement pertinente pour chaque individu devient telle que les 
m&hodes actuelles de memorisation et de recherche d'information ne sont gueres suffisantes. A 
cote des systemes perrnettant de retrouver une information rangee explicitement (tels que les 
15 « liens favoris ») ou par mots-cle (via un moteur de recherche), on souhaiterait avoir a 
disposition un procede qui spontanement propose des informations pertinentes en fonction du 
contexte. 

On connait les systemes qui fournissent des liens pertinents (ou plutot « related links » en 
20 terminologie anglo-saxonne) par rapport a une page courante visit6e sur le Web. Typiquement 
ces systemes comprennent une extension au navigateur Internet qui communique avec un serveur 
distant qui fournit les liens pertinents en fonction de la page courante presentee dans la fenetre 
principale du navigateur. Typiquement ces liens sont presentes, sous la forme d'une liste d'URL, 
dans une fenStre adjacente a ta fen@tre principale 4u navigateur. 

25 Cependant de tels systemes ne sont pas &endus pour servir de memoire associative. 
Resume de Y invention 

Un objet de la presente invention est de proposer des procedes et systemes informatiques de 
recherche de ressources (notamment pages Web, documents informatiques divers) « proches » de 
ressources donn^es (cette notion de proximity etant explicitee plus loin), ainsi que des precedes 
30 de gestion associative de ressources. 

En particulier, l'invention vise k caracteriser des elements d'information par rapport a de 
nouvelles pages qui apparaissent sur le Web, ouvrant ainsi la voie a de multiples nouvelles 
applications de gestion dynamique de contenu par rapport au contexte de navigation de 
Tutilisateur. 

35 Plus pr6cis6ment, l'invention vise a ce qu'^ chaque element d'information soient associ^s des 
liens sur des pages Web pertinentes qui le caracterisent et qui sont automatiquement tenus a jour. 
On peut ainsi caracteriser des informations non textuelles, comme les photos, les sons et les 
animations (en Flash, etc.) et s61ectionner dynamiquement les elements a presenter a Tutilisateur 
en fonction du contexte de sa navigation qui est 6galement caracterisee par des ensembles de 

40 pages Web pertinentes. Cette approche convient notamment, mais non exclusivement, aux 
magazines dans Tart de vivre, la mode et dans tous les autres domaines "de gofits" ou il est 
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difficile de caract<§riser par des mots-cle Tinteret qu'un abonn6 porte a rinformation (quand par 
exemple elle reprSsente une musique, un objet d'art, un plat culinaire, etc.), 

Un autre objet de Pinvention est d'associer a des elements d' informations d'autres Elements 
cibtes, tels que des publicity cibldes, en ^change d'un service innovant de memoire associative 
5 offert aux internautes. 

En particulier, on vise a ce que, typiquement au mqyen d'une extension de leur navigateur 
(extension t6techargeable k partir d'un site Web donne), les utilisateurs puissent utiliser les 
elements d' information de ce site comme « memoire associative ». Ainsi, pendant la navigation 
de I'utilisateur, l'61ement le plus pertinent du site par rapport k la page Web visit^e - ainsi que par 

10 rapport au contexte de navigation - lui sera spontanSment pr6sente; I'utilisateur pourra alors 
glisser-deposer sur cet element n f importe quelle ressource de son ordinateur, telle que Ticone 
d'un fichier du poste client, ou encore PURL d'une page Web, pour la memorises Ensuite, A 
chaque fois qu f il va visiter une page Web quelconque mais pertinente par rapport a cet 616ment, 
la ressource qu'il avait memorisee lui sera spontanement presentee, avec en plus les ressources 

15 (telles que des publicity) que l'auteur de l'616ment avait lui-meme associe a 1'element. Les 
publicites presentees correspondent ainsi aux centres d'interet courants de I'utilisateur et sont 
foumies en ^change d'un nouveau service de memoire associative. 

L'invention vise par ailleurs a mettre a profit les interfaces utilisateurs modernes pour creer, 
d'une mani&re particulierement simple et intuitive, des associations entre ressources 
20 d' informations (pages Web, ou fichiers de documents) notamment dans le cadre des objectifs ci- 
dessus. 

L'invention propose selon un premier aspect un procede pour determiner des ressources 
additionnelles pertinentes par rapport a un ensemble donne de ressources de depart, caract^rise 
en ce qu'il comprend les etapes suivantes 

25 a) identifier un ensemble de ressources citantes constituees par toutes les ressources ayant 

un lien vers au moins Tune des ressources de depart, 

b) former un ensemble de ressources candidates constitu6 par P ensemble des ressources 
cities par les ressources citantes, 

c) pour chaque ressource candidate, calculer un score de pertinence de ressource 
30 candidate entre ladite ressource candidate et P ensemble de ressources de depart sur la base de 

1 'existence de liens situes dans les ressources citantes et diriges vers la ressource candidate et 
vers les ressources de depart, et sur la base egalement de scores de pertinence de ressources 
citantes affectes k chacune des ressources citantes, 

d) pour chaque ressource citante, recalculer un score de pertinence de ressource citante 
35 sur la base de 1' existence, dans la ressource citante en question, de liens vers les ressources 

candidates et sur la base ggalement des scores de pertinence de ressource candidate attributes 
aux ressources candidates k P&ape c), 

e) rtpeter le cas tcheant P&ape c) et le cas echtant une ou plusieurs fois l'&ape d) puis 
Petape c), 

40 f) determiner lesdites ressources additionnelles pertinentes comme 6tant les ressources 

candidates qui presentent les meilleurs scores de pertinence de ressource candidate (et le cas 
£ch£ant Egalement les ressources citantes qui presentent les meilleurs scores de pertinence de 
ressource citante). 



WO 03/057648 




IPCT/FR03/00089 



3 

Le calcul de score de pertinence effectue £ Pttape c) avantageusement comprend le calcul d'une 
plurality de sommes de scores de pertinence de ressources citantes, chaque somme comprenant 
uniquement les scores de pertinences des ressources citantes comprenant un lien vers une 
ressource donnte constitute par la ressource candidate ou une ressource de depart. 

5 De fafon preferee, le proctde ci-dessus comprend egalement le calcul d'au moins une somme de 
scores de pertinence de ressources citantes, chaque somme comprenant uniquement les scores de 
pertinences des ressources citantes comprenant un Hen vers Tune parmi un ensemble d'au moins 
deux ressources donnees, cet ensemble comprenant la ressource candidate et au moins une 
ressource de depart. 

10 Selon un deuxitme aspect, ^invention propose un procedt pour determiner des ressources 
additionnelles pertinentes par rapport a un ensemble donnt de ressources de depart, caracttrist 
en ce qu'il comprend les etapes suivantes 

a) identifier un ensemble de ressources cittes constitutes par toutes les ressources ayant 
un lien depuis au moins Tune des ressources de depart, 

15 b) former un ensemble de ressources candidates constitue par V ensemble des ressources 

citant les ressources citees, 

c) pour chaque ressource candidate, calculer un score de pertinence de ressource 
candidate entre ladite ressource candidate et Pensemble de ressources de depart sur la base de 
Pexistence de liens situts dans la ressource candidate et dans les ressources de depart et dirigts 

20 vers les ressources citees, et sur la base egalement de scores de pertinence de ressources citees 
affectts a chacune des ressources cittes, 

d) pour chaque ressource citte, recalculer un score de pertinence de ressource citee sur la 
base de Pexistence, dans la ressource citee en question, de liens depuis les ressources candidates 
et sur la base tgalement des scores de pertinence de ressource candidate attributes aux ressources 

25 candidates a Petape c), 

e) rtpeter le cas echeant Petape c) et le cas echtant une ou plusieurs fois Petape d) puis 
Petape c) 

f) determiner lesdites ressources additionnelles pertinentes comme ttant les ressources 
candidates qui prtsentent les meilleurs scores de pertinence de ressource candidate (et le cas 

30 tchtant tgalement les ressources cittes qui prtsentent les meilleurs scores de pertinence de 
ressource citee), 

LMnvention propose en outre un systeme de navigation parmi des ressources d' information, 
chaque ressource comprenant au moins un lien activable dans un premier mode par un dispositif 
d'entrte pour provoquer Pacces a une autre ressource d' informations designee par un 
35 identificateur de ressource associt k ce lien, caracterist en ce qu'au moins certaines ressources 
comprennent au moins un lien activable dans un second mode a Paide d'un dispositif d'entree 
pour envoyer a un moteur de recherche de nouvelles ressources d' informations une requete de 
recherche contenant V identificateur de ressource associt au lien en question. 

Ce syst&me prtsente les aspects prtferts mais facultatifs suivants : 

40 * le dispositif d'entree est apte a acttver le lien simultantment dans les premier et second 

modes. 
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* P activation du lien dans le second mode est apte k provoquer l'affichage d'une requete 
pre-existante, k laquelle P identificateur de ressource associe au lien en question est susceptible 
d'etre ajoute. 

* Pactivation du lien dans le second mode est apte a afficher, en plus de la requite pre- 
5 existante, la ressource d' informations designee par ledit identificateur de ressource. 

L'invention propose egalement un systeme de recherche de nouvelles ressources d'information a 
partir de ressources d'informations existantes, caracterisd en ce qu'il comprend un moteur de 
recherche base sur l'analyse de liens entre differentes ressources et acceptant en entree une 
requete comprenant une serie d'identificateurs de ressources, un moyen de selection 
10 d'identificateurs apte k mSmoriser un ensemble d'identificateurs (URI) de ressources 
selectionn6s les uns apres les autres par un utilisateur, et un moyen gen&ateur de requete 
activable par Putilisateur pour engendrer une requete contenant l'ensemble des identificateurs 
pr£c6demment selectionn^s k destination du moteur de recherche. 

De fa9on prefgree mais non limitative, le moyen de selection est apte a m^moriser les 
15 identificateurs selectionnes de manidre r6manente, de telle sorte que le moyen de selection puisse 
etre mis en oeuvre de fa?on espacee dans le temps en vue de la generation d'une meme requete. 

L'invention propose par ailleurs un procede de recherche de nouvelles ressources d'information k 
partir de ressources d'informations existantes, caract£ris6 en ce qu'il comprend la mise en oeuvre 
d'un moteur de recherche basS sur l'analyse de liens entre differentes ressources et acceptant en 
20 entree une requSte comprenant une serie d'identificateurs de ressources et en ce qu'il comprend 
les Stapes suivantes : 

- selection d'identificateurs (URI) de ressources les uns apr6s les autres par un 
utilisateur ; 

- generation d'une requete contenant l'ensemble des identificateurs pr^cedemment 
25 selectionnes a destination du moteur de recherche. 

II est egalement propose un procede de recherche de nouvelles ressources d'information k partir 
de ressources d'informations existantes, caracteris£ en ce qu'il comprend la mise en oeuvre d'un 
moteur de recherche base sur l'analyse de liens entre differentes ressources et acceptant en entree 
une requete comprenant une serie d'identificateurs de ressources et en ce qu'il comprend les 
30 etapes suivantes : 

- generation d'une requete contenant un ensemble d'identificateurs de ressources 
precedemment memorises dans un meme groupe d'identificateurs de ressources propre a un 
utilisateur, a destination du moteur de recherche, 

- generation d'une signalisation a l'attention de Putilisateur lorsqu'au moins un nouvel 
35 identificateur de ressource appartenant au groupe en question a ete trouve par le moteur. 

Selon un aspect prefere du precede ci-dessus, chaque groupe d'identificateurs de ressources est 
represente par un objet graphique sur un dispositif d'affichage de Putilisateur, et en ce que ladite 
signalisation est realisee au moins par changement d'apparence de cet objet graphique. 

L'invention propose en outre un procede de gestion de ressources dans un systfeme informatique 
40 pourvu d'un ecran d'affichage et d'un dispositif d'entree pour deplacement et actionnement de 
curseur tel qu'une souris, chaque ressource possedant une representation affichee sur Pecran de 
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mantere k pouvoir etre d6plac6e a Paide du dispositif d'entrfe, procede caract^rise en ce qu'il 
comprend les etapes suivantes : 

- deplacement de la representation d'une premiere ressource pour Pamener au-dessus de 
la representation d'une seconde ressource, 

5 - puis memorisation, dans une memoire de gestion associative de ressources, 

d' informations d'association entre les premiere et deuxteme ressources. 

Certains aspects pr6f6r£s, mais facultatifs, de ce procede sont les suivants : 

* Petape de deplacement est effectuee par une technique de glisser-deposer. 

* le procede comprend en outre, suite a T identification d'une ressource donn^e dans un 
10 processus de consultation de ressources, les etapes suivantes : 

- lecture de la memoire de gestion associative de ressources pour determiner si k ladite 
ressource donn^e sont associees d'autres ressources, et 

- dans l'affirmative, signalisation sur Pecran d'affichage de l'existence de la ou des 
ressources associees. 

15 * les ressources comprennent des fichiers. 

* les ressources comprennent des ressources accessibles par un r^seau tel que PInternet. 

* P identification d'une ressource donn^e est obtenue par un processus d' identification de 
ressources similaires ou pertinentes par rapport a au moins une ressource de depart. 

* dans le cas ou la lecture de la memoire de gestion associative determine Pexistence de 
20 plusieurs ressources associees, Petape de signalisation comprend la signalisation ordonnee d'au 

moins une partie desdites plusieurs ressources associees. 

* la signalisation ordonnee est bas£e sur la determination de scores de pertinence desdites 
ressources associees. 

* la memoire de gestion associative de ressources est contenue dans un serveur accessible a partir 
25 d'une pluralite de postes individuels dans lesquels Petape de deplacement peut etre mise en 

oeuvre. 

* les associations entre ressources sont memorisees utilisateur par utilisateur. 

* les associations entre ressources sont memorisees de fa9on mutualisee entre plusieurs 
utilisateurs. 

30 L'invention propose egalement un procede pour identifier k partir d'une ressource de texte, une 
partie de ladite ressource susceptible de constituer une requete significative pour un moteur de 
recherche, caracterise en ce qu'il comprend les etapes suivantes : 

- oter du texte les mots non significatifs ; 

- etablir et completer une memoire de liens entre parties dudit texte, ou une partie est liee k une 
35 autre quand elle contient au moins un mot significatif en commun ; 

- mettre en ceuvre un procede de determination de scores de ressources par analyse d'un graphe 
de noeuds de ressources relies par des liens, ou chaque ressource utilisee dans ce procede est 
constituee par une partie du texte, sur les parties de texte ainsi liees entre elles ; 
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- utiliser au moins Pune des parties de texte constitudes par les ressources candidates determinees 
par ledit procSde comme texte de requete ou comme base pour un texte de requete. 

Avantageusement, P6tape de mise en oeuvre du proc6de de distillation de ressources est effectuee 
seulement avec des parties de texte selectionnSes comme preponderates, ou les parties de texte 
5 citantes sont les parties de texte qui comprenant au moins un mot en commun avec la ou les 
parties de texte preponderates, ou un lien est cre£ k partir de chaque partie de texte citante vers 
la ou les parties de texte preponderates, ou les parties de texte contenant au moins un mot 
egalement contenu dans ies parties de texte citantes sont identifiees, pour former un groupe de 
parties de texte co-citees, et ou est temporairement cre6 un lien h partir de chaque partie de texte 
10 citante vers chaque partie de texte co-cit6e avec laquelle ladite partie de texte citante poss&de au 
moins un mot en commun. 

Les parties de texte sont typiquement des phrases. 

Selon un autre aspect, Pinvention propose un procSde de gestion de ressources d'information 
telles que des pages Web dans un systeme informatique comprenant un poste utilisateur dot£ 
15 d'un ecran d'affichage, chaque ressource possedant un identifiant (URI) permettant son acces a 
partir du poste utilisateur, proced£ -caract^rise en ce qu'il comprend les Stapes suivantes : 

(a) declaration par 1 'utilisateur d'une association entre deux ressources, en associant a une 
deuxieme ressource Pidentificateur d'une premiere ressource ; 

(b) identification d*autres ressources pertinentes par rapport a la deuxieme ressource ; et 

20 (c) lors de V acces a Tune des autres ressources (page courante), signalisation de 

Pexistence de la premiere ressource. 

Selon certains aspects preferes mais non limitatifs : 

* P6tape (b) comprend la selection d'autres ressources les plus pertinentes pour la mise en oeuvre 
de 1'etape (c). 

25 * 1'Stape (a) est mise en oeuvre pour une pluralite de deuxiemes ressources appartenant k un 
groupe, et en ce que 1'etape (b) comprend T identification d'autres ressources pertinentes par 
rapport h Pensemble des deuxiemes ressources du groupe. 

* TStape (b) est declenchSe par la realisation de 1'etape (a). 

* l^tape (b) est mise en oeuvre posterieurement a Pacers prevu a Petape (c) pour determiner si 
30 Pautre ressource a laquelle il a 6t6 accede est une autre ressource pertinente par rapport a la 

deuxieme ressource. 

* P&ape (b) est mise en oeuvre par fourniture d'un identificateur de la deuxieme ressource a un 
serveur de determination de ressources pertinentes. 

* P6tape (b) est mise en oeuvre par identification d'autres ressources pertinentes par rapport a au 
35 moins une ressource intermediaire (spot) par rapport a laq\ielle la deuxieme ressource est 

pr6d£terminee comme etant pertinente. 

* le proc£d6 comprend en outre Paffichage, au voisinage d'une zone d'affichage de ressources, 
de representations de liens vers au moins certaines parmi les premieres ressources, les ressources 
intermediaires, et des ressources pertinentes par rapport aux ressources intermediaires. 

40 * l'&ape (a) est mise en oeuvre par action a Paide d'un dispositif d'entree sur des objets 
graphiques repr^sentatifs des premiere et deuxidme ressources. 
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L' invention propose par ailleurs un procede pour identifier des ressources d' informations 
accessibles par liens (telles que des pages Web) r^centes, pertinentes par rapport k au moins une 
ressource donnee, caracteris£ en ce qu'il comprend les Stapes suivantes : 

- appliquer une requete comprenant un identificateur de ladite ressource donnee a un syst&me de 
5 determination de pertinence entre ressources, 

- s&ectionner un premier ensemble de ressources les plus pertinentes (e.g. meilleurs scores 
pivots) par rapport a ladite ressource donnee, 

- rechercher, dans chacune des ressources les plus pertinentes, des regions possedant des liens 
vers d'autres ressources de pertinence elevee en moyenne, dites regions pertinentes, 

10 - surveiller P apparition, dans lesdites regions pertinentes, de nouveaux liens qui pointent vers des 
ressources qui n'dtaient pas encore connues du systeme, dites nouvelles ressources, 

- s61ectionner un deuxieme ensemble de ressources ayant une pertinence elev6e (e.g. meilleurs 
scores autorite hypertexte) par rapport a ladite ressource donnee, 

- sdlectionner les nouvelles ressources qui ont une similarity de contenu la plus 6Ievee par rapport 
15 aux ressources dudit deuxieme ensemble de ressources et donner aux nouvelles ressources 

selectionnees un niveau de pertinence {score autoriti de similarite) dependant du temps en 
fonction de ladite similarity de contenu. 

Selon un autre aspect encore, Pinvention propose un procede pour permettre Pacces par un 
utilisateur k des d'entites d 5 informations pertinentes a partir d'une entite d' informations de 
20 depart, chaque entity d 9 inform at ions etant accessible par un identifiant (URI), caract£ris£ en ce 
qu'il comprend les etapes suivantes : 

a) prevoir au moins une entite d 5 informations similaire, presentant un contenu similaire a celui de 
P entite de depart, et determiner Pidentifiant de la ou de chaque entite d' informations similaire, et 

b) determiner a partir du ou de chaque identifiant d'entit6 d' informations similaire un ensemble 
25 d'un ou plusieurs identifiants d'entites d' informations pertinentes par rapport a la ou chaque 

entite d'informations similaire. 

Des aspects prefi6r6s, mais non limitatifs du procede ci-dessus sont les suivants : 

* le proced6 comprend en outre P£tape suivante : 

c) permettre a Putilisateur Pacces a au moins certaines informations pertinentes k partir de leurs 
30 identifiants respectifs. 

* le procede comprend en outre Petape suivante : 

d) a partir des identifiants d'entites d'informations pertinentes et d'un ensemble donne d'entites 
d'informations supptementaires, s&ectionner les entitSs supplementaires les plus similaires aux 

35 entites d'informations pertinentes. 

* le proc6d£ comprend une etape supptementaire de tri des entit6s d'informations pertinentes par 
degre de pertinence. 



WO 03/057648 




PCT/FR03/00089 



8 

* l'etape de tri est prectdte d'une 6tape de calcul d'un score de pertinence par rapport k la ou 
chaque entitS d' informations similaires pour chacune des entites d' informations pertinentes. 

* chaque entite d'informations est constitute par un fragment de page tcrite en langage de 
5 marquage normalise, ou par une telle page dans son ensemble. 

* chaque identifiant est constitue par un identificateur uniforme de ressource (URI) du fragment 
ou de la page. 



10 * Petape a) est tealisee par selection par 1'utilisateur d'une ou plusieurs entites d'informations 
similaires a 1'entite d'informations de depart. 

* l'etape a) est rSalisee par mise en oeuvre d'uii processus de determination automatique d'entites 
d'informations similaires. 

15 

* l'etape a) est realisee par mise en ceuyre d'un processus de determination automatique d'entites 
d'informations similaires, suivie d'une selection par 1'utilisateur d'une ou plusieurs entites 
d'informations similaires parmi les entites d'informations similaires determines par ledit 
processus. 

20 

* l'etape b) est realisee par mise en oeuvre d'un processus de determination automatique d'entites 
d'informations pertinentes. 

* le processus de determination automatique d'entites d'informations pertinentes comprend 
Panalyse d'une structure de graphe d'identifiants constitute par les identifiants d'entites 

25 d'informations et par les identifiants dtsignes par des liens activables par 1'utilisateur contenus 
dans lesdites entites d'informations. 



Selon un autre aspect de 1' invention, un procede pour determiner des scores de pertinence 
d'unites de texte telles que des phrases dans un document textuel, comprend les dtapes 
30 suivantes : 

- decomposition du document en une plurality d'unites de texte, 

- selection d'au moins une unite de texte pertinente et d'unites de texte candidates, 

- determination de 1'ensemble des mots signifiants contenus dans P unite (ou les unites) de 
texte pertinente(s) et dans chacune des unites de texte candidates, 

35 - pour chaque mot signifiant contenu dans Punite (ou les unites) de texte pertinente(s), 

identification des unites de texte candidates citant ce mot signifiant, pour former un groupe 
d'unites de texte citantes, 
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- identification des unites de texte candidates contenant au moins un mot signifiant 
egalement cite dans les unites de texte citantes, pour former un groupe d 'unites de texte co- 
atees, 

- affectation aux unites de texte co-citees un score de pertinence en fonction desdites 
5 citations. 

L'invention propose aussi un precede pour determiner des scores de pertinence d'unites de texte 
telles que des phrases dans un document textuel, caracterise en ce qu'il comprend les etapes 
suivantes : 

10 - decomposition du document en une plurality d' unites de texte, 

- selection d'au moins une unite de texte pertinente et d' unites de texte candidates, 

- determination de 1'ensemble des mots signifiants contenus dans 1'unite (ou les unites) de 
texte pertinente(s) et dans chacune des unites de texte candidates, 

- pour chaque mot signifiant contenu dans l'unite (ou les unites) de texte pertinente(s), 
15 identification des unites de texte candidates comprenant ce mot signifiant, pour former un groupe 

d'unites de texte cites, 

- identification des unites de texte candidates contenant au moins un mot signifiant 
dgalement cite dans les unites de texte cites, pour former un groupe d'unites de texte co-citantes, 

- affectation aux unites de texte co-citantes un score de pertinence en fonction desdites 
20 citations. 

52. Procede pour determiner des scores attribues a des mots ou groupes de mots contenus 
dans des unites de texte telles que des phrases dans un document textuel, caracterise en ce qu'il 
comprend une etape qui consiste a additionner les scores de pertinences, determines par l'un des 
precedes ci-dessus, des unites de texte dans lesquels lesdits mots se trouvent. 

25 

Brfeve description des dessins 

Les figures 1 a 7 des dessins annexes illustrent differentes etapes mises en oeuvre dans la presente 
invention. 

30 Description detailtee de formes de realisation prefetees 
Lexique 

Ressource (ou element): Resspurce d'information telle qu'une page Web, une partie de page 
Web, un document, ou encore un element XML. Chaque ressource peut elle-m§me etre 
constituee de ressources, formant ainsi une structure arborescente. 

35 Ressource courante : Ressource accedee par l'utilisateur au moment courant lors d'une navigation 
(e'est notamment la page Web visualisee dans la fenetre principale du navigateur). 

URI (Uniform Ressource Identifier) : Adresse de ressource . Sera parfois utilise comme 
synonyme de URL (universal ressource locator). 
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Lien : URI plac6 dans une ressource. En g6n£ral, en cliquant sur un lien, l'utilisateur peut 
acc^der & la ressource pointee par lui. 

Citer (Une premiere ressource cite une deuxieme ressource) : La premiere ressource possede un 
lien vers la deuxieme ressource. 

5 Populaire : Se dit d'une ressource qui est acc6d6e par un grand nombre d'utilisateurs (par 
exemple sur le Web) k partir de son URI. 

Ressource priv6e : Ressource qui n'est pas accessible par un grand nombre d'utilisateurs 
(notamment qui n'est pas publtee sur le Web ou qui n'est pas largement connu). 

Memorisation associative : Ajout d'un lien vers une premiere ressource, sur une deuxieme 
10 ressource, afin de pouvoir retrouver la premiere ressource par le proc£d6 de recherche 
associative . 

Recherche associative : Afin de retrouver une premiere ressource, acceder a une ressource 
pertinente par rapport a une deuxieme ressource sur laquelle un lien sur la premiere ressource a 
6t€ ajout£. 

1 5 Lien aiout£ : URI insere par l'utilisateur dans un ensemble de liens associes. 

Spot propose : Spot presente par le systeme en priority car comportant les liens associes les plus 
pertinents par rapport au contexte courant. 

Spot : Un spot est compose: 

- d'un ensemble de liens, en general associes & une ressource de reference. Les ressources 
20 pointees par les liens associes sont accessibles (par exemple sur le Web) a partir de leur URI 

respectifs. Les liens associes sont composes de liens associes donnas et de liens associes 
completes, 

- et (optionnellement) d'un ou plusieurs ensemble de lien(s) (en particulier liens ajoutes par le 
createur du spot et liens ajoutes par des utilisateurs du spot), proposes) a l'utilisateur dans le 

25 cadre du proced6 de recherche associative, 

- et (optionnellement) d'un lien vers ladite ressource de reference, lesdits liens associes &ant 
s61ectionn6s comme etant pertinents par rapport a cette ressource de reference, 

Domaine de pertinence d'un spot : Ensemble des ressources designees par les liens associes de ce 
spot. 

30 Liens associes donnas : Liens associes specifies explicitement (par celui qui cr€e ou qui publie la 
ressource a laquelle ledit ensemble est assocte, ou encore par celui qui cv6e un spot pour cette 
ressource). 

Liens associes completes : Liens associes determines automatiquement (notamment au moyen 
d'un algorithme de distillation relative d6crit dans la presente description). 

35 Score de lien assocte : Score de pertinence par rapport a Pensemble des liens associes donnes. Ce 
score peut etre calculi par un algorithme de distillation relative tel que l'un de ceux dgcrits dans 
la presente description. 

Score autoritg : Score de pertinence d'une ressource par rapport k un ensemble de liens associes 
donnas. 
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Score pivot : Score de pertinence d'un ressource citant d'autres ressources, representant la 
pertinence des ressources cities par rapport a un ensemble de liens associes donn6s. 

Score non-contextuel : Score de pertinence ne dependant pas du contexte. 

Score contextuel : Score de pertinence dependant du contexte. 

5 Spot non-contextuel par rapport a une ressource (ou h un ensemble de ressources) en question: 
Spot dont les liens associes comprennent FURI de la ressource en question (ou au moins certains 
des URI des ressources en question) avec un score (ou une moyenne de scores) superieur(e) a un 
seuil donn6 ou qui est selectionne de maniere a le (ou la) maximiser (cf. la m&hode de selection 
de spot decrite dans la pr6sente description). 

10 Spot contextuel : Spot dont les liens associes sont les plus pertinents part rapport au contexte . 

Contexte : Contexte de navigation. 

Spotserver : Serveur sur PInternet fournissant ^association entre lien associe et spot. 

Spotserver courant : Spotserver auquel l'utilisateur est directement connecte. 

Region pertinente d'une ressource : Partie d'une ressource contenant au moins un lien pertinent 
15 et ne contenant pas de lien non pertinent. 

Procedes de memorisation et de recherche associatives 
[Vocabulaire utilise : 

premiere page = page memoris^e par l'utilisateur afin qu'il puisse la retrouver facilement ; 

20 deuxieme page = page utilisee par l'utilisateur comme support de memorisation (pour memoriser 
une association avec la premiere page, que Ton denommera dans la suite par « pour memoriser la 
premiere page » par souci de concision) ; 

page courante = page presentee au moment courant dans la fenetre principale du navigateur 
Internet. 

25 II s'agit par exemple de pages Web, toutefois la premiere page peut etre une ressource privee 
telle qu'un document (document texte, multimedia ou autre) qui lui appartient]. 

Le systeme permet a l'utilisateur d'ajouter un lien vers une premiere page sur n'importe quelle 
deuxieme page (ou au voisinage de la deuxi^me page ; on utilisera dans la suite T expression 
« sur la deuxieme page » par souci de concision). 1 

30 L'utilisateur accdde aux pages au moyen d'un navigateur dote de Textension propre au systeme 
(ou via un serveur Web intermediate). Aj outer un lien peut se faire par exemple par un glisser- 
deposer : l'utilisateur attrape une poignee representant la premiere page et la depose sur la 
deuxieme page ; par exemple le lien ajoute est alors presente par le systeme comme une vignette 
dans le style d'un « post-it » a l'endroit ou il a ete depose, ou dans une fenetre adjacente k la 

35 fenetre principale du navigateur (ou dans un cadre adjacent au cadre presentant la page Web 
d'origine). II peut aussi la deposer sur une icone representant la deuxieme page (par exemple 



1 L'&ape consistant k ajouter ainsi un lien, sur une deuxieme ressource, vers une premiere ressource (afin de pouvoir 
la retrouver par le procSde" ddcrit dans ce rapport) est appelee memorisatio n associative . 
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dans ses liens favoris). Le syst&me memorise alors la relation avec Putilisateur 
considers, P association entre le lien sur la premiere page et la deuxi&me page en question. 

Ensuite, quand Putilisateur accede a une page pertinente par rapport a la deuxieme page (ou a la 
deuxteme page elle-rneme), PURI 2 de ce lien aioutg vers la premiere page lui est 
5 automatiquement pr6sent£. 

Ainsi, pour retrouver la premiere page, Putilisateur n'a qu'a acceder a une page quelconque 3 qui 
soit pertinente par rapport k la deuxi&me page. 

Plus simplement, dans la mesure ou : 

- Putilisateur choisit ladite deuxieme page parce qu'elle est pertinente par rapport k la premiere 
10 page 

- et que la relation de pertinence est transitive k ce niveau, 

pour retrouver la premiere page, l'utilisateur n'a qu'a acceder k n'irhporte quelle page (accessible 
par le systeme) qui soit pertinente par rapport a la premiere page : c'est le proc6d6 de recherche 
associative . 4 

15 Noter que lors de P6tape de memorisation associative Putilisateur peut augmenter ses chances en 
ajoutant un lien vers la premiere page sur plusieurs deuxiemes pages. 

Par ailleurs, dans la mesure ou les relations de pertinence sont symetriques, les liens ajoutes sont 
implicitement bidirectionnels. En outre, dans le cas ou la page courante est une ressource privee, 
le systeme peut Passimiler a la (aux) deuxieme(s) page(s) sur laquelle (sur lesquelles), le cas 
20 echeant, Putilisateur avait ajoute un lien vers cette ressource privee, et presenter les autres 
premieres pages qu'il avait egalement ajoutees sur cette (ces) deuxteme(s) page(s). 

L'6tape de memorisation associative peut etre automatisee (ou etre assistee par ordinateur). En 
effet, Pajout d'un lien vers une premiere page sur une deuxieme page peut etre (semi-) 
automatisee selon les etapes suivantes : 

25 I - determiner des mots-cles ou des phrases principales de la premiere page (contenus dans la 
page ou associ^s a elle - par exemple delimits par des balises de type « meta-tag »), 

II - fournir ces mots-cles ou phrases principales a un moteur de recherche qui retournera un 
ensemble de liens sur des pages contenant ces mots-cles, 

ill - en prendre au moins un sous-ensemble (par exemple les N meilleurs selon le moteur de 
30 recherche) pour les utiliser comme deuxiemes pages, 

IV - aj outer un lien vers la premiere page sur ces deuxiemes pages. 

Noter qu'en ce qui concerne P&ape I, diverses techniques d'extraction automatique des mots- 
cles ou des phrases principales d'un texte existent d£ja. 



2 Ainsi qu'optionnellement d'autres indications concernant le lien ajoutg, te! que le texte ou Pobjet graphique qui 
accompagne le lien ajoute, ou encore une presentation simplifiee ou miniaturisee de la premiere page elle-mSme. 

3 Ladite page quelconque est deja ou devra §tre prise en compte par le systeme. L'utilisateur preTerera ainsi choisir 
une page populaire pour accelerer la recherche. Le systeme est muni d'un crawler dont le but est justement de 
prendre en compte le plus possible de pages accessibles (notamment sur ['Internet) et qui interessent l'utilisateur. 

4 Pour faciliter la lecture, on decrit ici le procecte de memorisation/recherche associative en parlant de pages, mais le 
proc6d6 s'applique plus largement a des ressources (pas seulement a des pages). 
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On peut egalement extraire du texte les mots-ctes, de la manure suivante : 

- pour chaque mot, determiner le score de ce mot en additionnant les scores des phrases dans 
lesquelles il se trouve et ensuite normaliser ces scores (par exemple en divisant chaque score 
ainsi obtenu par la racine carr6 de la somme des carrSs de tous les scores ainsi obtenus) ; 

5 - selectionner les mots ayant les plus grands scores comme mots-cies. 

Les deux precedes presentes ci-dessus peuvent etre combines en ne retenant des mots-cle 
s61ectionn6s que ceux qui se trouvent dans les phrases s61ectionn£es. Le procede complet 
d'extraction des mots-cies du texte est alors comme suit : 

- 6ter du texte les mots non significatifs (appeies « stop words » dans la litterature) ; 

10 - identifier les liens entre les phrases : une phrase est liee k une autre quand elle contient au 
moins un mot en commun ; 

- appliquer la methode de distillation absolue (d^crite plus loin), ou une methode equivalente 
explpitant un graphe de liens (telle que PageRank), sur les phrases ainsi Itees entre elles, pour 
determiner leurs scores ; 

1 5 - pour chaque mot, determiner le score de ce mot en additionnant les scores des phrases dans 
lesquelles il se trouve et normaliser; 

- selectionner les phrases ayant les plus grands scores comme etant les phrases principales du 
texte. 

En variante, dans la mesure ou (une ou) certaines phrases du texte peuvent etre rep^rees comme 
20 etant preponderates, pour determiner les scores des phrases, au lieu de la methode de distillation 
absolue on peut utiliser la methode de distillation relative (decrite plus loin) pour determiner le 
score de pertinence des phrases par rapport auxdites phrases preponderantes. 

Par ailleurs, au lieu de phrases proprement dites, on peut consid£rer n'importe quelle sorte de 
parties ou unites de texte. Le procede utilisant la distillation relative consiste ainsi a determiner 
25 des scores de pertinence d' « unites de texte » (telles que des phrases) co-citees : 

On identifie les unites de texte comprenant au moins un mot en commun avec Tunite <ou 
Tensemble des unites) preponderante(s), pour former un groupe d'unites de texte citantes. On 
cree (temporairement) un lien a partir de chaque unite de texte citante vers Tunite (ou l'ensemble 
des unites) de texte pr6ponderante(s). 

30 On identifie les unites de texte contenant au moins un mot egalement contenu dans les unites de 
texte citantes, pour former un groupe d'unites de texte co-citees. On cr£e (temporairement) un 
lien & partir de chaque unite citante vers chaque unite co-citee avec laquelle ladite unite citante 
possede au moins un mot en commun. 

On applique ensuite un des procedes de calcul de scores de pertinence par la methode de 
35 distillation relative decrits plus loin. L'ensemble des identifiants des unites de texte pertinentes 
constitue les URI de la requete. 5 

On va maintenant decrire la mise en oeuvre du systeme de recherche associative. 



5 L'ensemble des identifiants des unites de texte citantes constitue Pensemble R. L'ensemble des identifiants des 
unites de texte co-cit6es constitue Pensemble K + , et ainsi de suite. 
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Pour presenter, a un utilisateur qui accede a une page courante, des liens sur des premieres pages, 
le systSme effectue les Stapes suivantes: 

Etape a : d6terminer le score de pertinence de deuxiemes pages candidates par rapport a la page 
courante, 6 

5 Etape b : s£lectionner les (ou un certain nombre de) deuxiemes pages ayant (le cas £ch6ant) un 
score de pertinence suffisant, 

Etape c. presenter a l'utilisateur les (URI des) premieres pages des liens quMl avait ajoute sur les 
deuxiemes pages qui ont et6 selectionn£es a Tetape b; optionnellement lui presenter aussi les 
(URI des) deuxiemes pages elles-memes. 7 

10 En variante, lors de la memorisation associative, au lieu d'ajouter sur la deuxieme page un lien 
vers la premiere page, l'utilisateur peut superposer a la deuxi&me page ou y inserer une 
annotation (ou n'importe quelle ressource telle qu'une ic6ne ou autre objet graphique), qui joue 
alors le role de premiere page au sens du present procede. Dans ce cas, lors P etape (c) de la 
recherche associative, le syst&rne pr6sente la ou les deuxiemes pages qui ont ete selectionn^es en 

15 presentant aussi leurs annotations (ou la ressource qui leur a ete ajoutee). 8 

Pour faciliter la lecture, on va considerer les 7 ensembles (voir la figure Fig. 1) suivants: 

• R est constitue par les pages 9 de la requete. 

• iT est Tensemble des pages qui contiennent un lien vers 10 au moins une page de la 
requSte. 

20 • JT* est Tensemble des pages point£es (citees) par au moins une page de R\ 

• R' + ' est Tensemble des pages qui citent au moins une page de R' + ( R~ a R~ + ~ ). 

• R + est Tensemble des pages citees par au moins une page de la requSte (R). 

• R*~ est Tensemble des pages qui citent au moins une page de R + . 

• R*' + est Tensemble des pages cities par au moins une page de R*' (R* ci? w ). 
25 — 

Pour determiner le score de pertinence des deuxiemes pages candidates par rapport k une page 
courante R (entendre ici R comme ressource courante 11 ), le systeme met en oeuvre un proc6d6 de 
« distillation relative » comprenant au moins Tune parmi les Stapes a et a' suivantes. 

Etape a : 



Cette dtape est composee de P6tape a et/ou I'gtape a' (voir plus loin. 

7 Pour ce faire, comme deja mentionne, le systeme possede en memoire la relation entre utilisateur, deuxieme page 
(sur laquelle l'utilisateur en question a ajoute des liens) et premiere page (lien ajoutS par l'utilisateur en question sur 
la deuxieme page en question). Ainsi le systeme peut tout d'abord determiner Pensemble des deuxiemes pages 
candidates pour l'utilisateur courant pour effectuer Petape a, puis a P6tape c retrouver les Hens ajoutes a presenter a 
l'utilisateur. 

8 Dans le reste de la description, par lien ajout6 sur une deuxieme page on entend que 1'on inclut ce cas de figure ou 
il y a une ressource ajoutee a la deuxieme page. 

9 (par « page » on entend « URI de page ») 

10 (autrement dit « qui citent », ou encore « qui pointent ») 

11 Car ici la requSte est formee d'une seule page. 
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Etape a-1 ; Identifier P ensemble R~ des pages qui poss£dent au moins un lien vers R ; 12 

Etape a-2 : Retrouver en memoire Pensemble des deuxiemes pages candidates pour Putilisateur 
courant et effectuer 1' intersection entre P ensemble R'* des pages pointees par les pages de R' 
(noter que R est dans i 'ensemble R' + ) et Pensemble des deuxiemes pages candidates pour 
5 Putilisateur courant ; 

Etape a-3 : Pour chaque page de Pensemble resultant de Petape a-2 5 calculer son score de 
pertinence (score autorite) par rapport a R. (Noter que cette etape inclut Pidentification de 
Pensemble des pages de iT + ~ possedant au moins un lien pointant vers au moins un sous- 
ensemble de l'ensemble resultant de Petape a-2 -voir la section « Selection des spots »). 

10 Etape a': 

Etape a'-l : Identifier l'ensemble R* des pages pointees par R \ 

Etape a 5 -2 : Retrouver en memoire l'ensemble des deuxiemes pages candidates pour Putilisateur 
courant et effectuer P intersection entre P ensemble R + ~ des pages possedant au moins un lien vers 
une page de R* (noter que R est dans P ensemble R + ') et l'ensemble des deuxtemes pages 
15 candidates pour Putilisateur courant ; 

Etape a'-3 : Pour chaque page de l'ensemble resultant de Petape a'-2, calculer son score de 
pertinence (score pivot) par rapport k R. (Noter que cette etape inclut Pidentification de 
l'ensemble des pages de R + ~* pointees par au moins un sous-ensemble de Pensemble resultant de 
Petape a'-2). 

20 Le calcul des scores de pertinence aux etapes a-3 et a'-3 peut s'effectuer au moyen notamment de 
Pune des 6quations presentees plus loin a la section « Selection des spots » qui decrit par ailleurs 
des ameliorations au procede present^ ci-dessus. Notamment les scores sont affines par iterations 
successives. Lors de ces iterations, les pages pivot dans Petape a et les pages autorite dans Petape 
a' acqui&rent aussi des scores de pertinence (respectivement scores pivot et scores autorite). En 

25 plus des deuxidmes pages candidates (c'est-a-dire en plus des URI des pages de R~* dans Petape 
a et/ou de R + ' dans Petape a') determinees comme decrit ci-dessus, on peut alors aussi inclure, 
dans Pensemble resultant fourcii a Petape b, les pages pivot de Petape a et les pages autorite de 
Petape a' (puisqu'elles ont maintenant des scores de pertinence). Par ailleurs les poids des liens 
entre pages proches* 3 sont amoindris pour ameiiorer les resultats davantage. 

30 Le systeme peut done seiectionner les deuxiemes pages les plus (ou suffisamment) pertinentes a 
Petape b et effectuer Petape c pour presenter a Putilisateur leurs liens ajoutes. 

Les resultats obtenus par le procede de distillation relative peuvent etre memorises (puis 
maintenus - voir plus loin la section « Maintenance des spots ») dans le but d'eviter de les 
recalculer lors des acc£s aux pages courantes deja traitees. Ainsi, le systeme maintient, dans une 
35 deuxieme memoire, les scores des deuxiemes pages par rapport aux pages courantes dans les cas 
ou ces scores sont superieurs a un seuil donne. Pour une page courante dej£ traitee, la reponse du 
systeme est alors quasi immediate. 

Autrement dit, Petape a est modifiee comme suit : 



On peut utiliser un moteur de recherche sur le Web pour d&erminer les ressources qui pointent vers une ressource 
donnSe. 

13 Pour identifier la proximites des pages aux extr6mit£s des liens le systeme identifie en plus l'ensemble des pages 
RT des pages possedant au moins un Hen vers les pages R" et V ensemble des pages R" 4 ^ des pages possedant au 
moins un lien vers les pages R**" (voir la section « Filtrage »). 
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Etape a' : consulter la deuxieme memoire pour savoir si les deuxiemes pages les plus pertinentes 
pour la page courante ont dSja 6t6 m6moris£es (et si ces donnees en memoire sont suffisamment 
fraiches), le cas £cheant passer a P6tape c, sinon determiner et m&noriser le score de pertinence 
de deuxiemes pages candidates par rapport a la page courante. 

5 En variante, le systeme memorise (puis maintient - voir plus loin la section « Maintenance des 
spots ») les donnees necessaires sans attendre qu'un utilisateur accede a une page courante ; la 
memorisation est declench^e par ^utilisation, par Putilisateur, d'une nouvelle deuxieme page 
(comme support de memorisation associative). 

En exploitant le fait que les scores de pertinence sont reflexifs 14 , le systeme part de chaque 
10 deuxidme page pour construire R~ et RT + (et R~*') et/ou R + et (et R ++ ) 9 calcule par distillation 
relative les scores de pertinence de toutes les pages courantes potentielles, et les memorise dans 
une deuxieme memoire (c'est une memoire inverse apte a fournir, pour chaque page courante 
potentielle, les deuxi&mes pages pertinentes). 

Par ailleurs, comme deja indique, le systeme maintient une premiere memoire contenant les liens 
1 5 ajoutes par utilisateur et deuxieme page. 15 

Ainsi, quand un utilisateur accede r£ellernent a une page courante, le systeme s£Iectionne dans la 
deuxieme memoire les deuxiemes pages - parmi les deuxiemes pages utilises par cet utilisateur 
comme support de memorisation 16 - qui ont les scores de pertinence les plus eleves par rapport a 
ladite page courante, puis retrouve (dans la premiere memoire) les liens ajoutes par cet utilisateur 
20 sur ces deuxiemes pages. 

Autrement dit, le precede comprend les Stapes suivantes 17 . 

Pour chaque nouvelle deuxieme page R (sur laquelle un utilisateur ajoute un lien) 18 : 

Etape ml: Effectuer au moins Tune des etapes ml-1 et ml-1', puis effectuer P£tape ml-2 : 

Etape ml-1 : 

25 - identifier P ensemble R' des pages qui possedent au moins un lien vers R ; 

- identifier Pensemble R' + des pages courantes potentielles point6es par les pages de R' ; 

- pour chaque page de R' + (sauf R) calculer son score de pertinence (score autorite - voir la 
section « Selection des spots ») par rapport k R ; noter que cette 6tape inclut Identification de 
Pensemble des pages R + ' possedant au moins un lien pointant sur au moins un sous-ensemble de 

30 7T + (voir la section « Selection des spots »); 

Etape ml-1': 

- identifier Pensemble R* des pages vers lesquelles R possede au moins un lien; 



(i.e. le score de pertinence d'une deuxieme page par rapport a une page courante est 6gal au score de pertinence de 
cette page courante par rapport a cette deuxieme page) 

15 Noter que, avantageusement, les donnees dans la deuxieme memoire ne sont pas par utilisateur et peuvent ainsi 
servir a tous les utilisateurs. 

16 (celles-ci sont indiquees dans la premiere memoire) 

17 Les Stapes ml et m2 ddcrivent ie precede de memorisation associative, les etapes a, b et c d£crivent le procedd de 
recherche associative. 

l8 L'6tape ml est effectu^e seulement pour les nouvelles deuxiemes pages, tandis que P&ape m2 est effectu6e 
chaque fois qu'une deuxieme pages utilised par un utilisateur, qu'elles soit nouvelle pour le systeme ou pas. 
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- identifier Pensemble des pages courantes potentielles pointant vers au moins une page de 
R + ; 

- pour chaque page de R*~ (sauf R) calculer son score de pertinence (score pivot - voir la section 
« Selection des spots ») par rapport a R ; noter que cette etape inclut 1' identification de 

5 1' ensemble des pages pointees par au moins un sous-ensemble des elements de ; 

Etape ml -2 : m^moriser, dans une deuxieme memoire, les URI des pages ayant un score de 
pertinence suffisant par rapport a R, en relation avec R, de maniere a ce qu'a partir de l'URI de 
chacune desdites pages ayant un score de pertinence suffisant par rapport a R on puisse 
retrouver 19 (la deuxieme page) R ainsi que ledit score de pertinence suffisant; 

10 Etape m2 : (en parallele avec l'etape ml) m^moriser dans une premiere memoire, pour chaque 
utilisateur et chaque deuxieme page, les liens .ajoutes que ledit utilisateur a ajoute sur ladite 
deuxieme page ; 

Lors de Faeces a une page courante par un utilisateur : 

(L'etape a n'est plus necessaire puisque les scores sont deja en memoire). 

15 Etape b-m : Selectionner dans la deuxieme memoire un certain nombre de deuxiemes pages 20 , 
parmi les deuxiemes pages utilisees par ledit utilisateur (indiques dans la premiere memoire), 
pour lesquelles les scores de pertinence de ladite page courante sont les plus Sieves (s'ils 
existent); 

Etape c (inchangSe) : Retrouver dans la premiere memoire les liens ajoutes par ledit utilisateur 
20 sur les deuxiemes pages s^Iectionnees k l'etape b-m et les presenter audit utilisateur (avec 
optionnellement les deuxieme page$ sur lesquelles ils ont 6t6 ajoutes et de maniere trtee). 

On appliquera egalement les ameliorations presentees plus loin k la section « Selection des 
spots ». Notamment comme les scores sont affines par iterations successives, les pages pivot 
dans retape ml-1 et les pages autorite dans Tetape ml-1' acquierent aussi des scores de 
25 pertinence (respectivement scores pivot et scores autorite) et peuvent ainsi etre inclus dans 
l'ensemble resultant fourni a l'etape ml-2 (en plus des URI des pages de R' + dans l'etape ml-1 
et/ou de R*' dans Tetape ml-1'). Par ailleurs, ici aussi les poids des liens entre pages proches 
sont amoindris pour ameliorer les resultats (voir la section « Filtrage »). 

Avec ce dernier procede, les liens ajoutes sont pr6sentes quasi immediatement par le systeme 
30 dans tous les cas, c'est-a-dire meme quand une page courante est accedee par un utilisateur pour 
la premiere fois. 

On avait mentionne que lors de l'etape de memorisation associative Putilisateur peut augmenter 
ses chances en ajoutant un lien vers la premiere page sur plusieurs deuxiemes pages. On va 
maintenant lui permettre de former des groupes de deuxiemes pages auxquelles est ajoute un lien 
35 vers la premiere page (l'idee etant que, comme la premiere page peut etre interessante par rapport 
a plus d'un centre d'interet de 1'utilisateur, les groupes permettent de classer la premiere page par 
rapport h des centres d'interet distincts, chaque groupe correspondant k un centre d'interet 
different). 



19 (ainsi que les autres deuxiemes pages, le cas £cheant, pour lesquelles le score de pertinence de R est suffisant) 

20 Normalement, dans la deuxieme memoire, les URI des deuxiemes pages pertinentes par rapport a une page 
courante potentielle sont deja tries par score de pertinence. 
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Concrfetement, chaque fois que Putilisateur ajoute un lien (vers la premiere page) sur une 
nouvelle deuxteme page, le ou les groupes de deuxifemes pages qu'il avait d6ja formes le cas 
echeant pour la premiere page lui sont proposes par le systeme et il peut alors choisir un ou 
plusieurs de ces groupes dans lesquels insurer ladite nouvelle deuxieme page, ou sinon il peut 
5 creer un nouveau groupe form6 de la seule nouvelle deuxieme page. 

II peut aussi par la meme occasion manipuler ses groupes plus largement, comrne par exemple 
supprimer une deuxieme page d'un groupe, scinder un groupe en deux, fusionner deux groupes, 
supprimer un groupe, etc. Enfin, il peut aussi dupliquer un groupe pour y ajouter un lien sur une 
autre premiere page. 

10 Chaque groupe est traite par le systeme comme une requite de distillation relative. De maniere 
similaire au dernier proced6 decrit 21 , pour chaque requSte R (c'est-a-dire pour chaque groupe de 
<leuxiemes pages) le systeme identifie et . memorise (puis maintient - voir plus loin la section 
« Maintenance des spots ») les pages courantes potentielles qui ont un score de pertinence 
suffisant, et forme ainsi une memoire inverse apte a fournir, pour chaque page courante 

1 5 potentielle, les requetes les plus pertinentes (c'est-a-dire les groupes les plus pertinents). 

Autrement dit, la memorisation associative comprend les Stapes suivantes : 

(L'etape ml est effective seulement pour les requStes non d6ja connus par le systeme ou pas 
suffisamment fraiches, tandis que l'etape m2 est effectuee pour toutes les requetes des 
utilisateurs, qu'elles soient nouvelles pour le systeme ou pas). 

20 Etape ml: Effectuer au moins Tune des Stapes ml-1 et ml-T, puis effectuer l'etape ml -2 : 

Etape ml-1 : 

- identifier Pensemble R~ des pages qui possedent au moins un lien vers une page de R ; 

- identifier P ensemble R' + des pages (vues comme pages courantes potentielles) pointees par au 
moins une page de R' ; 

25 - pour chaque page de R~* (sauf R) calculer son score de pertinence (score autoritS - voir la 
section « Selection des spots ») par rapport a R ; noter que cette Stape inclut P identification de 
Pensemble des pages R"*~ poss6dant au moins un lien pointant sur au moins un sous-ensemble de 
R"^ (voir la section « Selection des spots »); 

Etape ml-r: 

30 - identifier Pensemble R + des pages vers lesquelles au moins une page de R possede un lien; 

- identifier Pensemble R*' des pages courantes potentielles pointant vers au moins une page de 

R + ; 

- pour chaque page de R + ~ (sauf R) calculer son score de pertinence (score pivot) par rapport a R ; 
noter que cette etape inclut P identification de Pensemble des pages R +_+ pointees par au moins un 

35 sous-ensemble de R + ~ ; 

Etape ml -2 : m^moriser, dans une deuxi&me m£moire, les URI des pages ayant un score de 
pertinence suffisant par rapport & R> en relation avec R 9 de maniere k ce qu'a partir de PURI de 



21 La difference est qu'ici R represente une requete formde d'une ou plusieurs ressources alors qu'avant R 
repr^sentait une seule ressource (une seule deuxieme page). 
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chacune desdites pages ayant un score de pertinence suffisant par rapport k R on puisse 
retrouver R ainsi que Iedit score de pertinence suffisant; 

Etape m2 : (en parallele avec l'etape ml) mSmoriser dans une premiere mgmoire, pour chaque 
utilisateur et requete, les liens ajoutes (vers premieres pages) ; 

5 Lors de l'acces a une page courante par un utilisateur : 

Etape b-m : Selectionner dans la deuxteme m^moire un certain nombre de requetes, parmi les 
requetes (groupes) utilisdes par Iedit utilisateur comrae support de memorisation associative 
(indiques dans la premiere m^moire), pour lesquelles les scores de pertinence de ladite page 
courante sont les plus eleves (s'ils existent); 

10 Etape c : Retrouver dans la premiere memoire les liens ajoutes par Iedit utilisateur sur les 
requetes selectionnees a l'etape b-m et les presenter audit utilisateur, avec optionnellement : 

- les (ou un certain nombre des) requetes sur lesquelles Us ont ete ajoutes, 

- ainsi qu'un certain nombre de (liens vers des) pages pertinentes ayant un score de pertinence 
estime (a l'etape ml-2) suffisant par rapport auxdites requetes selectionnees k l'etape b-m. 23 

15 On appliquera egalement les ameliorations presentees plus loin a la section « Selection des 
spots ». Notamment comme les scores sont affines par iterations successives, les pages pivot 
dans l'etape ml-1 et les pages autorite dans l'etape ml-1' acquierent aussi des scores de 
pertinence (respectivement scores pivot et scores autorite) et peuvent ainsi etre inclus dans 
1'ensemble resultant fourni a l'etape ml-2 (en plus des URI des pages de R' + dans l'etape ml-1 

20 et/ou de R*~ dans l'etape ml-1 5 ). Par ailleurs les poids des liens entre pages proches sont ici aussi 
amoindris pour ameliorer les r£sultats (voir la section « Filtrage »). 

A l'etape b-m, le systeme fournit un ensemble de requetes selectionnees. II serait avantageux 
d'affiner la selection de maniere a presenter a l'utilisateur (la ou) les requStes 24 qui soient les plus 
pertinentes par rapport au contexte de navigation de l'utilisateur. C'est ce que l'on va maintenant 
25 decrire. 

L'histoire de la navigation d'un utilisateur est modeiisee a l'aide d'une «pile de contexte », ou a 
chaque lien (pouvant etre pr£sente k l'utilisateur) est associe un score de pertinence k chaque 
niveau de navigation, et quand un lien est inexistant on l'assimile a un lien dont le score est 6gal 
a zero. 

30 Quand l'utilisateur clique sur un lien et accede a une nouvelle page, le systeme ajoute un niveau 
k la pile de contexte. En revanche, quand il clique sur la commande « Back » de son navigateur 
le systeme depile un niveau. 

Pour un lien donne, le score contextuel est une moyenne des scores non contextuels 25 a chaque 
niveau de la pile de contexte, ponderes en fonction de la profondeur. Afin de ne pas avoir a 
35 recalculer tous les scores k chaque fois, on utilise une ponderation exponentielle, ce qui fait que 



(parmi 1' ensemble des requetes memorisees, le cas echeant, pour cette page) 

Ces URI sont analogues aux « related links » mentionnes 4 la section « L'etat de la technique », cependant ils sont 
plus pertinents car leurs scores de pertinence ont et£ calcules par rapport a la requete a laquelle ils sont associes par 
distillation relative. 

(avec les premieres pages et les liens pertinents correspondants) 
25 (c'est-a-dire determines en ne tenant pas compte du contexte) 
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le score contextuel k un certain niveau est la moyenne poncteree du score non contextuel k ce 
niveau et du score contextuel au niveau precedent. 

Autrement dit, pour un URI donne, s etant le score non contextuel au dernier niveau et r le score 
contextuel au niveau precedent, le score contextuel au dernier niveau est : lambda.r + (1 — 
5 lambda).s (lambda etant une ponderation constante entre 0 et 1, en principe infSrieure a J4 : plus 
lambda est grand, plus le passe a d'importance). 

Parmi les requetes (c'est-&-dire les groupes) seiectionnees k 1'etape b-m, le systeme seiectionne 
celles qui sont les plus proches du contexte, c'est-&-dire celles pour lesquelles les scores des URI 
memorises k Tetape mI-2 sont les plus proches des scores contextuels pour Putilisateur en 
10 question. Pour determiner la proximity de chaque requete avec le contexte, le systeme calcule la 
somme des produits, pour chaque URI de la requete, du score (non-contextuel) de la requdte avec 
le score contextuel pour Putilisateur en question. 

L'etape b-m est ainsi remplacee par Petape b'-m suivante : 

Etape b'-m : Selectionner dans la deuxieme memoire un certain nombre de requetes, parmi les 
15 requites (groupes) utilisees par ledit utilisateur comme support de memorisation associative 
(indiques dans la premiere memoire), pour lesquelles les scores de pertinence de ladite page 
courante sont les plus elev^s (s'ils existent) et pour lesquels les scores de pertinence des pages 
courantes potentielles sont les plus proches des scores de pertinence contextuels. 

On va mairitenant decrire un procede, exploitant le systeme des cookies, pour reconnaitre 
20 Putilisateur quand il passe d'un site a Pautre, de maniere a pouvoir maintenir sa pile de contexte. 

Rappelons que le systeme des cookies permet aux serveurs de sites d'un domaine Internet (i.e. 
nom de domaine ou adresse IP) de reconnaitre un utilisateur (c'est-a-dire son ordinateur) quand il 
accede a des pages Web appartenant a un meme domaine Internet. 

Le proced^ que Pon d£crit ici permet a un serveur, qui met en oeuvre notre procede - on 
25 Pappellera serveur client (CLI) - de reconnaitre mSme les utilisateurs qui naviguent d'un site k 
Pautre qui ne font pas partie d'un meme domaine Internet, meme d'ailleurs si dans leur 
navigation ces utilisateurs passent par des sites qui ne mettent pas en oeuvre notre procede. 

Pour ce faire, trois mecanismes de communication sont utilises : 

1- Chaque page Web d'un site d'un serveur client contient un cadre (frame) dont Padresse est 
30 celui d'un serveur centralise (URS) qui gere notre procede de reconnaissance de Putilisateur 

(USER) ; 

2- Le serveur centralise et chaque serveur client ont chacun un cookie memorise dans 
Pordinateur de Putilisateur (noter que le temps de creation de ces cookies peut etre utilise pour 
estimer la fiabilite de reconnaissance de Putilisateur) ; 

35 3- Le serveur client communique avec le serveur centralise directement. 

II y a trois cas possibles qui sont decrits ci apres (voir figure 2). 

Nouvel utilisateur pour le serveur client et pour le serveur centralise : 

1. L'utilisateur (Pordinateur USER) ouvre une page du site client (serveur CLI) ; il n'y a pas 
de cookie CLI. 

40 2. CLI demande a URS un identifiant libre pour USER et re9oit ID= "123456" 
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3. CLI renvoie k USER une page comprenant deux cadres 

• Le premier cadre est a Padresse http://URS.com/.. .?ID= "123456" 

• Le deuxteme cadre est k Padresse http://CLI.com/... 

4. USER envoie a URS la requSte http pour demander le contenu du premier cadre 
5 <http://URS.com/.. .?ID= "123456") ; comme il n'y a pas de cookie appartenant k URS, URS 

conclut qu'il s'agit d'un nouvel utilisateur et Iui attribue Pidentifiant "123456", 

5. URS rdpond et installe un cookie (contenant ID= " 123456") chez USER 

6. (en parallele avec 5.) URS transmet [ID="123456" (pas de remplacement)] a CLI 

7. (en parallele avec 4.) USER envoie k CLI la requete http pour demander le contenu du 
1 0 deuxi&ne cadre 

8. (apres reception de Pidentifiant au point 6) CLI envoie a USER le contenu du cadre 
http://CLI.com/... 

Nouvel utilisateur pour le serveur client mais pas pour le serveur centralise : 

1 . USER ouvre une page du site client (serveur CLI) ; il n'y a pas de cookie CLL 
1 5 2. CLI demande a URS un identifiant libre pour USER et re9oit ID= "123456" 

3. CLI renvoie a USER une page comprenant deux cadres 

• Le premier cadre est a Padresse http://URS.com/.. .?ID= "123456" 

• Le deyxieme cadre est k Padresse http://CLI.com/... 

4. USER envoie a URS la requete http pour demander le contenu du premier cadre 
20 (http://URS.com/.. .?ID= "123456) ainsi que le contenu du cookie (cre6 lors d'un acces precedent 

et comportant Pidentifiant ID="ABCDEF") 

5. URS r^pond 

6. (en parallele avec 5.) URS transmet [ID="ABCDEF" rempla9ant ID=" 123456"] a CLI 
(+optionnellement des donnees suppl^mentaires propres k ID="ABCDEF") 

25 7. (en parallele avec 4.) USER envoie k CLI la requete http pour demander le contenu du 
deuxieme cadre 

8. (apres reception de Pidentifiant "ABCDEF" au point 6.) CLI envoie a USER le contenu 
du cadre http://CLI.com/... ainsi qu'un nouveau cookie comportant ID="ABCDEF" en 
remplacement du precedent 

30 Utilisateur d£ja connu du serveur centralise et du serveur client : 

L USER ouvre une page du site client (serveur CLI) et transmet le contenu du cookie 
associe a CLI (ID=" ABCDEF") 

2. (cette etape n'est pas applicable) 

3. CLI renvoie a USER une page comprenant deux cadres 

35 • Le premier cadre est a Padresse http://URS.com/.. .?ID= "ABCDEF" 

• Le deuxteme cadre est k Padresse http://CLI.com/... 
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4. USER envoie a URS la requete http (http://URS.com/.. .?ID== "ABCDEF", pour 
demander le contenu du premier cadre) ainsi que le contenu du cookie (cre6 lors d'un acc£s 
prSc&Ient et comportant aussi ID- 1 ABCDEF") 

5. URSnSpond 

5 6. (Optionnellement, CLI peut demander et/ou recevoir de URS des donnees 
supptementaires pour ID=" ABCDEF") 

7. (en parallele avec 4.) USER envoie a CLI la requete http pour demander le contenu du 
deuxteme cadre 

8. CLI envoie a USER le contenu du cadre http://CLI.com/... (le cas ech^ant apres reception 
10 des donnees h P6tape 6.) 

Le procede ddcrit ci-dessus permet de sdlectionner les liens a afficher dans les pages Web en 
fonction du contexte de navigation 26 . C'est ce qu'on va maintenant decrire. 

Partons de la situation ou chaque requete (le serveur qui Pheberge) possede un ensemble d'URI 
initiaux ainsi que ^ensemble des liens qui pourraient etre proposes a Putilisateur avec leurs 
1 5 . scores par defaut : les scores non contextuels. 

Comme deja d£crit, le score contextuel est une moyenne des scores non contextuels a chaque 
niveau de la pile de contexte, pond£res en fonction de la profondeur. Ainsi, n etant le score non 
contextuel au dernier niveau et r f le score contextuel au niveau precedent, sa valeur apres avoir 

suivi un lien est : r f h-> Xr f + Xr f 27 
20 Les liens presents a l'utilisateur sont ceux qui ont le plus grand score contextuel. 

La pile de contexte peut etre affich6e dans le cadre URS (le premier cadre) introduit plus haut. 
Ainsi l'utilisateur peut voir quelles sont les pages qui sont intervenues dans le calcul des pages k 
afficher. II peut cliquer des 616ments de la pile pour remonter des niveaux, et un bouton « Erase » 
permet de vider la pile de contexte. 

25 La pile de contexte est stock^e, pour chaque utilisateur, dans le serveur centralise (URS), avec 
Pidentifiant de Putilisateur. Ainsi, chaque fois qu'un utilisateur ouvre une page chez un serveur 
client (CLI), celui-ci, ay ant obtenu l'identifiant de 1' utilisateur, va donner a URS les scores non 
contextuels 28 , lequel r6pondra avec les scores contextuel apres avoir effectuS la moyenne 
pond&rde d^crite plus haut 29 . Le serveur du site client pourra alors afficher dans la page les liens 

30 qui ont le meilleur score. 

Les Stapes sont ainsi les suivantes (voir figure 3): 

1 . L'utilisateur (USER) envoie une requete http pour ouvrir une page 



26 (ou, comme ctecrit plus haut, de selectionner les requites elles-memes ; ceci &ant trivial on ne le decrit pas a 
nouveau) 

__d-\ 

27 Ce qui donne r f = /ij] ^^t % „ + ^ r i x a avec d la profondeur de la racine et r /;rt le score de la page Pj a la 
profondeur n. 

Pour eViter du tratlc inutile on peut selectionner les pages a envoyer en ne prenant que celles qui ont un score 
supeYieur a un certain seuil, par exemple la moitte du seuil exige* pour qu'une page soit afifich^e a Tutilisateur 
29 Ceci s'effectue dans le cadre de PStape 6 decrit plus haut. 
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2. Le serveur client (CLI) transmet au serveur centralist (URS) les scores non contextuels 
de la page en question et l'identifiant de l'utilisateur 

3 . URS ajoute un niveau au contexte et calcule les scores contextuels 

4. Les scores contextuels (du moins les meilleurs d'entre eux) sont retournSs au serveur 
5 client 

5. Le serveur client sSlectionne les liens qui ont le meilleur score et les pr£sente a 
l'utilisateur. 

II peut etre int6ressant d'une part de grouper les liens dans differentes parties des pages, voire 
meme de hierarchiser les parties, c'est-a-dire de permettre & des parties de contenir des sous- 
10 parties, en plus de liens. Voici les changements que cela implique : 

• Le contexte courant 30 doit contenir des informations de contexte pour chaque partie de la 
page affichee, done lorsque la page envoie ses scores non contextuels, elle en envoie autant qu'il 
y a de parties, et URS lui x6pond avec un contexte pour chaque partie. Pour eviter certains 
probldrnes (voir points suivants) il faut Egalement un contexte par defaut, qui represente la page 

1 5 elle-meme et ses parties et qui cumule tous les scores de tous les liens 

• Lorsque l'utilisateur clique sur un lien, il faut que le contexte de la partie qui contient ce 
lien soit utilise comme contexte de dernier niveau (i.e. ce contexte-la sera utilis6 pour le calcul 
des scores aux niveaux suivants). Un moyen d'obtenir ce resultat est de mettre dans les adresses 
des liens un argument qui contient un identifiant (unique pour la page) de la partie, identifiant qui 

20 est egalement transmis a URS avec les scores non-contextuels. 

• Dans la mise en oeuvre du procedt decrit ici, il faut faire attention a ne pas confondre les 
parties de differentes pages, par exemple si l'utilisateur a ouvert plusieurs fenetres de son 
navigateur et clique dans une fenetre apres avoir clique dans une autre (URS ne stocke qu'une 
pile de contexte). Ceci peut se faire en comparant le champ HTTP Referer avec l'adresse du 

25 dernier niveau de la pile et ne tenir compte du numtro de partie qu'en cas d'egalitt, Dans les 
autres cas (egalement si i'utiiisateur est passe par une page d'un site non client) on prend le 
contexte par dtfaut. 

Un exemple plus complet (voir figures 4 et 5) : 

Voici done ce qui se passe lorsque l'utilisateur, d6ja dans un contexte parti culier (pour la page 
30 cl.com/main.html), clique sur un lien http://CLI.com/index.html?partie=l . (partie=l signifie que 
1'utilisateur a cliqu6 dans la partie 1). On suppose que le serveur client CLI ne connait pas encore 
l'utilisateur : 

(1) Le navigateur (USER) envoie la requete http://CLI.com/index.html?partie=l au serveur 
du site client (CLI) en lui donnant en plus le Referer http://cl.com/main.html (l'adresse de ce 

35 cadre). 

(2) CLI va demander a URS un num£ro libre (il lui repond avec 12345) pour cet utilisateur 

(3) CLI repond a (1) avec une page comprenant deux cadres dont les adresses sont 
http://URS.com/default.html?newId=12345 et http://CLI.com/main.html respectivement. II lui 
donne de plus un cookie temporaire (de session) newld=12345. 



C'est-i-dire l'ensemble des scores contextuels des Hens au niveau courant. 
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(4) L'utilisateur Stant connu de URS, il a un cookie avec son vrai identifiant (678910). En 
chargeant les cadres, il (son navigateur) va envoyer tine requete pour la page 
http:/AJRS.com/default.html?newId= 12345 avec le cookie ID=678910. 

(5) L'utilisateur envoie 6galement une requete pour la page http://CLf.com/main.html avec 
5 le cookie de session newld= : 12345. 

(6) Ayant re9u (5), le client CLI envoie a URS son adresse (http://CLLcom/main.htmn . ses 
scores non contextuels, pour chaque partie de la nouvelle page, 1' identifiant newID= 12345, ainsi 
que le numero de partie (partie=l) qu'ii avait refu au .message (1). 

(7) Quand il a re9ii (4) et (6), URS regarde le contexte de l'utilisateur pour la partie 1, 
10 vSrifie que la page source (http://CLIxom/main.htmD correspond au dernier niveau de la pile de 

contexte pour cet utilisateur (sinon il aurait ignore le numero de partie et pris la partie par defaut 
"D"). Ensuite il calcule, pour chaque partie de la nouvelle page les nouveaux scores contextuels. 

(8) URS, ayant re9u le message (6), peut repondre au message (4) de l'utilisateur (lui 
pr^sentant la nouvelle pile de contexte et le bouton <ERASE>). 

15 (9) URS repond 6galement au message (6) de CLI en lui envoyant le vrai identifiant de 
Tutilisateur (678910), ainsi que les scores contextuels. 

(10) CLI peut maintenant repondre au message (1), en donnant k rutilisateur sont vrai 
identifiant (cookie permanent ID=678910, pour le site CLLcom), ainsi que la page personnalisee. 

La notion d'utilisateur peut en r^alite englober plusieurs utilisateurs qui partagent des liens 
20 ajoutes (et les groupes qui leurs servent de support). Bien entendu, une organisation plus fine des 
utilisateurs selon les liens ajoutes qu'ils partagent est possible. 

On va maintenant decrire le cas ou un utilisateur final s'abonne chez un utilisateur foumisseur 
afin que, selon le contexte, le systeme propose a l'utilisateur final les groupes et premieres pages 
(au sens des groupes et premieres pages d&rites jusqu'ici) cre£s par l'utilisateur foumisseur. Les 
25 premieres pages peuvent notamment etre des publicites qui (grace aux capacites du systeme que 
l'on a jusqu'ici) sont automatiquement sdlectionnes par rapport au contexte. 

Les groupes cre6s par Tutilisateur foumisseur et proposes par le systeme a l'utilisateur final sont 
appeles « spot ». 

L'utilisateur foumisseur manipule et exploite les spots comme on Ta decrit jusqu'ici pour les 
30 groupes de deuxidmes pages. 

L'utilisateur final peut utiliser un spot comme support de memorisation en en faisant une version 
personnelle et en y ajoutant un lien vers une premiere page (ceci est decrit plus loin). 

L'avantage principal de cette approche est de donner la possibilite de cr6er de nouveaux spots (et 
les coftteux calculs de scores qu'ils impliquent) k certains utilisateurs seulement (ce sont les 
35 utilisateurs foumisseurs) et d'offrir la fonction de memorisation/recherche associative par 
l'intermediaire de spots preexistants (qui n'est pas cofiteuse en ressources machines) a tous les 
utilisateurs. 



Spot 

40 Le systeme que nous allons maintenant d6crire fournit des liens pertinents (« related links », voir 
plus haut la section « L'etat de la technique »). Toutefois, plutot que de rechercher des liens 
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pertinents directement, notre systeme recherche d'abord s'il existe un spot -ou ressource de 
reference- dont les liens associes sont suffisamment proches de la ressource courante ou du 
■contexte de navigation de Putilisateur. Si c'est Ie cas, le syst&me retourne le (ou les) spot(s) dont 
les liens associes sont les plus proches, ainsi que ses liens assoctes offerts en guise de liens 
5 pertinents. 

Typiquement le spot est propose dans une fenetre adjacente a la fenetre principale du navigateur, 
comme les systemes existants fournissant des « related links », cependant contrairement & ces 
systemes existants 

- le systeme de Pinvention presente des liens pertinents -determines selon un precede de 
10 distillation relative (detailte plus loin), 

- le contexte de navigation pris en compte par notre systeme n'est pas forc^ment uniquement la 
page courante, mais peut inclure P ensemble des ressources accedSes recemment par rutilisateur 
(en utilisant le systeme) et qui sont pertinentes par rapport h la ressource courante 1 

- les spots servent de memoire associative pour les utilisateurs fournisseurs ; en effet, quand un 
15 spot est presente h un utilisateur final, les liens vers premieres pages (ou autres ressources 

ajoutees , comme decrit precedemment) ajoutes par Putilisateur fournisseur qui a cree le spot 
sont pr^sentes audit utilisateur final 33 , 

- les spots servent de memoire associative pour les utilisateurs finaux ; en effet, quand 
Tutilisateur final ajoute un lien vers une premiere page sur une deuxieme page (comme on Pa 

20 decrit jusqu'ici), en reality il ajoute un lien sur sa version personnelle du spot proposS pour cette 
deuxieme page ou pour le contexte courant. 

En outre, presenter a Putilisateur final des liens pertinents par P intermediate de spots offre des 
avantages en soi, tel que Pincitation a cliquer pour acceder a la ressource de reference (c ! est-&- 
dire la page presentant le spot). 

25 Examinons maintenant quelques scenarios typiques de memorisation/recherche associative 
mettant en ceuvre les spots. 

Premier scenario d 'utilisation : 

L'utilisateur fournisseur cree une nouvelle ressource ou choisit une ressource existante (par 
exemple une page Web & Iaquelle il vient d'acc&ter, ou un element particulier contenu dans une 
30 page. . .) pour en faire la ressource de reference d'un nouveau spot. 

Pour ce faire, il Iui attribue au moins un lien associe donn6 pointant sur une page populaire. 

Le systeme complete Pensemble des liens associes 34 (comme decrit a la section « SSlectionner 
des spots »). 

Ainsi, dans le futur, chaque fois qu'un utilisateur final va acc6der k une ressource pointee par 
35 Pun des liens associes a ce spot, ce spot pourra 35 lui etre propose. 



31 Voir plus haut la description du proc£d6 de selection de groupes de deuxiemes pages (ici de spots) selon le 
contexte de navigation de rutilisateur. 

32 Celles-ci incluent notamment des publicites pour le compte d'annonceurs. Avantageusement, ces publicites sont 
pertinentes par rapport au contexte (en tout cas les spots qui leurs servent de support !e sont). 

33 (ce dernier pouvant d'ailleurs etre ledit utilisateur fournisseur qui a cree le spot) 

34 C'est I'equivalent de la deuxieme memoire decrite a la section prec6dente. 
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Et, comme on le decrit dans Jes deux scenarios d'utilisation suivants, des utilisateurs finaux 
pourront alors utiliser ce nouveau spot en tant que support de memorisation (de maniere analogue 
k 1'utilisation d'une deuxieme page ou d'un groupe de deuxidmes pages d^crits plus haut). 

Le crSateur de ce spot a ainsi Pavantage non seulement de s'en servir pour lui-mSme mais aussi 
5 de le voir propose a des utilisateurs finaux. Comme un lien sur la ressource de reference (incitant 
Putilisateur k cliquer) est inclus dans la presentation du spot, la ressource de reference est ainsi 
promue aupres des utilisateurs finaux. En plus, ses liens ajoutes (telles que des publicity) sur ce 
spot seront presentes aux utilisateurs finaux. 

Deuxieme scenario d'utilisation : 

10 Sur le Web Putilisateur final «tombe» sur une premiere page (ou autre type de ressource) 
tellement int6ressante qu'il voudrait la rn6moriser afin de pouvoir la retrouver facilement et 
retomber dessus spontanement quand il accede a des ressources pertinentes par rapport a elle. 

Supposons qu'aucun spot n'est spontanement propose par le systeme pour cette page. 36 

L'utilisateur visite une (au moins une) deuxieme page, qui soit pertinente par rapport a la 
15 premi&re, 

et pour laquelle il sait qu'un spot est propose, 

ou sinon il choisit une page Web qui soit populaire car il est ainsi plus probable qu'un 
spot soit propose pour elle, 

et sur le spot qui est propose pour cette deuxieme page il ajoute un lien vers cette premiere page 
20 (par exemple en selectionnant un objet graphique representant la premiere page et en en 
effectuant un glisser-d6poser sur la deuxieme page, comme decrit au debut de la description). 

Dans le futur, ce lien ajoute lui sera alors spontanement presente chaque fois que ce meme spot, 
ou qu'un spot proche, lui sera propose pour le contexte courant de sa navigation. 

Troisieme scenario d'utilisation : 

25 L'utilisateur Final veut memoriser une ressource privee (tel qu'un document qui lui appartient et 
qui n'est pas publie sur le Web). La ressource privee joue ici le role de premiere page. 

II accede a une (deuxieme) page qui est pertinente par rapport k sa ressource privee (et qui de 
preference est populaire, ou pour laquelle il sait qu'un spot est propose) et il lui ajoute un lien 
vers sa ressource priv£e (c'est-a-dire qu'il insure ce lien dans sa version personnelle du spot 
30 propose pour cette deuxieme page). 



35 Ce ne sera pas forc£ment ce spot qui sera propose mais plutot, parmi tous les spots dont des liens assoctes pointent 
vers des ressources formant le contexte courant, le spot dans lequel ces lien associes ont les scores de pertinence les 
plus Sieves (ou les spots dans lesquels ces lien associes ont les scores de pertinence les plus Sieves). La selection du 
ou des) spot est decrite a la section « S61ectionner un spot ». 

6 Dans le cas contraire, sur (sa version personnelle de) ce spot, l'utilisateur va directement ajouter un lien vers cette 
premiere page Web. Mais noter cette action n'est pas strictement nScessaire. En effet, deja sans rien faire 
l'utilisateur pourra retrouver cette premiere page en visitant une page proche et quelque peu populaire (en tant que 
lien pertinent associS a ce m€me spot ou a un spot voisin). Toutefois, en faisant cette action l'utilisateur a Pavantage 
supplemental re de pouvoir la retrouver en tant que lien ajoute* explicitement par lui, c'est-a-dire de maniere a ce 
qu'elle soit mise en evidence. 
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Optionnellement, pour renforcer son action, il va aussi ajouter un lien (vers sa ressource privee) 
sur encore (d'autres spots qui lui sont proposes pour) d'autres deuxtemes pages qu'il trouve 
pertinentes par rapport k sa ressource privee. 

Dans le futur, un lien vers sa ressource priv6e lui sera spontanement pr^sente chaque fois que 
5 Pun des spots qui lui 6taient proposes pour la ou les deuxieme(s) page(s), ou qu'un spot proche, 
lui sera propose pour le contexte courant de sa navigation. 

Ainsi, dans les deux derniers scenarios ci-dessus, un lien vers la premiere page est spontanement 
presents a Putilisateur chaque fois qu'il va visiter des pages dans ie domaine de pertinence 
couvert par les spots proposes pour les deuxtemes pages . 

10 

Selection des spots 

Avant Petape de selection de spot(s) proprement dit, le systeme doit obtenir Pensemble des 
« liens assoctes completes » &partir de T ensemble des « liens associes donnes » (qui sont donnes 
par l'utilisateur foumisseur, comme decrit dans le premier scenario d'utilisation). 

15 Completer les liens associes : 

L' ensemble des ressources pointees par les liens associes donnes est la requete R. 

Le calcul des liens associes completes s'effectue au moyen du procedS de « distillation relative », 
comprenant les etapes suivantes : 

Etape 1 : Identifier Pensemble R" des ressources qui possedent au moins un lien pointant sur un 
20 element de R. 

Etape 2 : Identifier Pensemble R" + des ressources pointees par les elements de R" (noter que R" + 
inclut R). 

Etape 3 : Pour chaque ressource de R" + calculer son score autorite par rapport k R. (Cette 6tape 
peut inclure P identification d'une partie des ressources de R" + " poss6dant un lien pointant vers 
25 une ressource de R" 4 ) 38 . 

Etape finale : Selectionner les Elements de R"* ayant les plus grands scores autorite. 

Le calcul des scores a P&ape 3 peut s'effectuer en calculant, pour chaque ressource de R" + 5 le 
rapport entre 

- la cardinality de l'ensemble des ressources qui pointent vers elle ET vers les ressources de la 
30 requete et 

- la cardinality de Pensemble des ressources qui pointent vers elle OU vers les ressources de la 
requete 

(ou au moyen de Pune des Equations plus completes decrites plus loin, voir notamment 
P equation de quantite de raisons communes -ou homog&ieite- d'un ensemble de ressources). 

35 Les scores autorites sont normalises (de maniere a ce que leur somme devienne £gale a 1). 



Et dans la mesure ou les deuxiemes pages ont €ii choisies par l'utilisateur parce que selon lui elles sont 
pertinentes par rapport a la premiere page, et la relation de pertinence est transitive a ce niveau, un Hen vers la 
premiere page est spontanement present^ a l'utilisateur chaque fois qu'il va visiter des pages qui selon lui sont dans 
le domaine de pertinence de la premiere page ! 

38 La prise en compte des ressources de K* dSbutera des la premiere iteration, comme decrit plus loin. 
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Les scores autorite dtant obtenus, on peut s'en servir pour attribuer des scores pivot aux elements 
deR": 

Etape 4 : Le score pivot de chaque 616ment de R" est obtenu en prenant la somme des scores 
autorit6 (calculus a I'&ape 3) des elements de R" + vers lesquels il pointe. Les scores pivots sont 
5 normalises (de maniere a ce que leur somme devienne egale a 1). 

Iteration en repartant de l'etape 3: Les scores pivots etant obtenus, on peut s'en servir pour 
affiner le calcul des scores autorite. L'etape 3 tient alors compte des scores pivot pour ne pas 
considerer tous les elements de R" sur un pied d'egalite (les ressources de R" pointant vers des 
ressources ayant un score autorite plus elevg auront ainsi une influence plus grande). Les 
10 cardinality utilises pour calculer les scores autorites sont ainsi remplacees par des cardinalites 
pondetees. C'est-a-dire que chaque ressource pivot, au lieu de compter pour un, compte 
proportionnellement a son score pivot. (Les equations sont detaillees plus loin). 

L'etape 3 inclut alors la prise en compte des ressources de R"*" pointant vers les ressources de R" + 
ayant les plus grands scores autorite, en plus de R" (un proced6 optimisant la prise en compte de 
1 5 R _+ " est ddcrit plus loin). 

Apres l'etape 3 on peut optionnellement effectuer l'etape 4 a nouveau, et ainsi de suite jusqu'a 
convergence, c ! est-&-dire jusqu'a ce que la difference entre les resultats obtenus dans la derniere 
iteration et ceux obtenus dans V iteration precedente soit negligeable (en general, moins de 10 
iterations suffisent). 

20 Variante pour l'etape 2 : Pour former R" + , au lieu de prendre tous les liens contenues dans les 
ressources R" le systeme ne prendra que les liens se trouvant dans les regions pertinentes des 
ressources de R\ Comme ces regions pertinentes ne peuvent etre determinees qu'^ partir du 
moment ou les scores pivot des liens qu'elles contiennent sont connus, on ne mettra cette 
variante en oeuvre qu'a partir de la premiere iteration, c'est-a-dire qu'apres avoir effectue T6tape 

25 4 le systeme va iterer en reprenant a partir de T^tape 2 plutdt qu'a partir de T£tape 3. 

Variante pour l'etape 3 : 

A chaque lien poss6de par une ressource de R" (ou de R" 4 "") est associe un poids egal au 
complement de la proximite des deux, ressources relives par ce lien. Ainsi, on va affaiblir les liens 
reliant deux ressources proches. On diminue ainsi l'importance des liens entre les ressources qui 
30 se promeuvent mutuellement (par exemple par ce qu'elle font partie d'un meme site Web et se 
citent mutuellement). Une fois que les liens sont ainsi pond6res, le systeme calculer les scores 
autorite en utilisant non plus la somme des scores pivots, mais la somme des scores pivots 
multiplies par leurs poids (ceci est detailte et illustre par un exemple plus loin). 

La proximite des deux ressources reltes par le lien en question est obtenue en calculant le rapport 
35 entre 

- la cardinality de Pensemble des ressources qui pointent vers les deux ressources reltees et 

- la cardinality de Pensemble des ressources qui pointent vers au moins une des ressources 
relives. 

(ou au moyen notamment de 1'une des equations plus completes d6crites plus loin). 

40 II est aussi avantageux d'effectuer le meme algorithme par l'aval, c'est-a-dire en calculant les 
scores pivot des ressources de R*~ (qui citent a l'aval les memes ressources que la requete). 
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Les algorithmes par l'aval sont identiques a ceux par 1'amont sauf que B (backward) est remplacd 
par F (forward) et vice-versa 39 , et " est interverti avec + (e.g. R' + est remplace par R + ~). 

On consid&rera aussi, avantageusement, les ressource pivots a 1'amont et les ressources autorites 
a l'aval, de maniere a ce que les pages pivot dans l'&ape ml-1 et les pages autorit6 dans P&ape 
5 ml-1' acqui&rent aussi des scores de pertinence (respectivernent scores pivot et scores autorit6) 
et puissent ainsi Stre inclus dans Pensemble resultant fourni k I'&ape ml -2 (en plus des URI des 
pages de R" + et/ou de R + "). 

En cornpletant les liens associSs de chaque nouvelle requdte (spot) introduite, le syst&me forme 
une memoire inverse apte k fournir, pour chaque ressource courante potentielle correspondant k 
10 un lien associe, les requetes les plus pertinentes (c'est-a-dire les spots les plus pertinents). 

Autrement dit, la memorisation associative comprend maintenant les 6tapes suivantes : 

(L'etape mO est effectuee de maniere independante des autres etapes. L'etape ml est effectuee 
seulement pour les requetes, non dej& connues par le systeme ou pas suffisamment fraiches, 
introduces par un utilisateur fournisseur, tandis que l'etape m2 est effectuee pour chaque 
15 ^utilisation d'une requ§te (c'est-a-dire d'un spot) comme support de memorisation associative par 
un utilisateur fournisseur ou un utilisateur final.) 

Etape mO : memoriser (dans une troisieme memoire) les droits d'utilisation de spots pour chaque 
utilisateur. 

Etape ml: 

20 L'etape ml-1 correspond a completer les liens assoctes comme decrit ci avant. 

Etape ml -2 : memoriser, dans une deuxieme memoire, les URI des ressources ayant un score de 
pertinence suffisant par rapport a R, en relation avec R, de maniere a ce qu'a partir de 1'URI de 
chacune desdites ressources ayant un score de pertinence suffisant par rapport k R on puisse 
retrouver 40 R ainsi que ledit score de pertinence suffisant; 

25 Etape m2 : {en paraltele avec l'etape ml) memoriser dans une premiere memoire, pour chaque 
utilisateur et requSte, les liens ajoutes (vers premieres ressources) ; 

Lors de Faeces k une ressource courante par un utilisateur : 

Etape b-m : Selectionner dans la deuxieme memoire un certain nombre de requetes, parmi les 
requetes (spots) que ledit utilisateur a le droit d'utiliser (indiques dans la premiere memoire), 
30 pour lesquelles les scores de pertinence de ladite ressource courante sont les plus Sieves (s'ils 
existent) et pour lesquels les scores de pertinence des liens assoctes sont les plus proches des 
scores de pertinence contextuels pour ledit utilisateur; 

Etape c : Retrouver dans la premiere memoire les liens ajoutes par ledit utilisateur sur les 
requStes sSlectionnees a l'etape b-m, ainsi que les liens ajoutes par leurs createurs (s'ils sont 
35 diffSrents dudit utilisateur), et les presenter audit utilisateur, avec optionnellement : 

- les (ou un certain nombre des) requetes sur lesquelles ils ont ete ajoutes, 

- ainsi qu'un certain nombre de (liens associes vers des) ressources ayant un score de pertinence 
estimd (a l'&ape ml -2) suffisant par rapport auxdites requetes s<Slectionnees a l'&ape b-m. 



39 B(Rf) est Pensemble des URIs des pages ayant un lien vers la page R h F(Rf) est 1'ensemble des URIs des pages 
vers lesquelles R f a un Hen. 

40 (parmi Pensemble des requites memorisees, le cas echeant, pour cette ressource) 
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On va maintenant d&ailler le proc6d6 de distillation relative. 

L'id^e essentielle du calcul du score de pertinence (d'une page Web P 2 par rapport a une page 
Web donnee Pi) est la suivante 41 : 

Soit pi la probability 42 qu'un auteur al^atoire (de page Web) mette dans une page un lien sur Py. 
5 Soit p2 la probability qu'un auteur al^atoire mette dans une page un lien sur P?. 

Soit p }&2 la probability qu'un auteur aleatoire, mette dans une page un lien sur Pj et un lien sur 

B(Pj) est l'ensemble des URIs des pages ayant un lien vers la page P h 

F(Pj) est l'ensemble des URIs des pages vers lesquelles P f a un lien. 

10 La pertinence d'une page par rapport a un ensemble de pages peut etre definie par la « quantity 
de raisons communes » d'etre interess6 par toutes ces pages. 

Des calculs algybriques permettent d'obtenir des equations dpnnant la quantite de raisons 
communes entre plusieurs pages. Cette quantite (ou proximite, ou encore homogeneity) est notee 
x 9 avec en indice les pages dont il est question ; la probability d'etre lie a une certaine page P,« est 
1 5 notee p { ; la probability d'Stre lie a au moins une page parmi P if P: }9 . . P n est notee jty...*. : 

— = Pi' P j_^ — _ P^_ P^ P*l P J *L= 9 e t ainsi de suite (tous les sous-ensembles de taille impaire 



P a ' Pij P»' Pij'Pik' Pjk 

au numyrateur, et les autres au denominateur) 43 

Cette equation peut etre notee.de fa9on plus compacte ainsi : x s = p P F avec cr p =(-i)ii. 



PcS 



Les probabilites dont il est question ci-dessus font intervenir le nombre (le comptage) des pages 
20 de R~ qui contiennent un lien donne ou un lien parmi un ensemble d'URI donnes (vers des pages 
de R ). On gagnerait h ponderer ce nombre par la qualite de citation (score pivot, dycrit plus 
loin) de chaque page qui contient un tel lien. 

On voudrait ainsi qu'une page de K citant plus de meilleures pages (de i?" + ) soit considyree 
comme ytant de meilleure qualite de citation, et qu'en retour un poids plus fort lui soit donny 



41 Ci-aprfcs, nous allons consid^rer que Pj et P 2 , (ou P h P j9 etc) sont des pages Web, bien que les procedes decrits 
soient bien plus generaux, comme on Ta deja mentionne. Par exemple, il est a noter qu'au lieu d' exploiter les Hens 
hypertextes et les requites comme mentionnes ci-dessus, le systeme peut etre bas6 sur une analyse des traces des 
copier-coller (ou couper-coller) de fragments d'information effectues par les utilisateurs (dans le cadre des creations 
et manipulations de ressource d'information), pour suggerer automatiquement d' autres fragments qui sont 
susceptibles d^nrichir ces ressources. Ces traces peuvent en effet etre assimilees a des liens. Par exemple, quand on 
copie une partie d'une page Web dans un document, le systeme est capable d'en deduire et de memoriser l'existence 
dans le document d'un lien vers la page Web, et les memes m^canismes decrits ici peuvent alors €tre appliques. Par 
ailleurs, le procedy que I 'on decrit ici peut avantageusement etre applique en assimilant les liens d'une ressource 
vers une autre ressource a des liens d'un utilisateur vers une ressource qu'il aime (c'est-a-dire vers une ressource qui 
l'interesse). On peut ainsi determiner la quantity de raisons communes (entre plusieurs ressources) d'etre aimyes par 
des utilisateurs. Ceci peut notamment servir a categoriser ces ressources. 

42 La probability d'etre interessS par une (ou certaines) page(s) est approchde en comptant le nombre de pages qui 
ont un lien sur elle(s) et en divisant ce nombre par une estimation du nombre de pages qui auraient pu en avoir. 

43 Les barres sup6rieures indiquent des complements, et p 03 la probabilite d'aimer au moins une page d'un ensemble 
vide, est une constante egale a zero ; elle est presente dans liquation pour des raisons de coherence. 
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dans le cadre du calcul des scores 44 des pages qu'elle cite (£"*), les scores des pages de R~ et ceux 
des pages de R' + s'influen9ant mutuellement dans une approche iterative (de renforcement 
bipartite) qui converge 45 . 

Le nombre de pages de R m+ ~ citant chaque page candidate (c'est-a-dire de R~*) intervient aussi 
5 dans les calculs. Or -leur prise en compte coute cher. On va alors approximer les resultats en ne 
consid^rant que celles qui citent les pages candidates ayant un bon score, ce score 6tant calcule 
d'abord en ne consid6rant que R' et ensuite en Stendant cet ensemble vers R~*~ progressivement 

Pour calculer le score de pertinence d'une page candidate, au lieu de prendre le r6sultat de 
liquation de quantite de raisons directement, il est preferable 

10 • de la prendre avec les cardinalites d'ensemble remplac^es par le total des scores pivot des 
pages en question et 

• de multiplier ce resultat par le score autorite de la page candidate (simplement calcule a 
partir du total des scores pivot des pages citantes), afin d'affaiblir ainsi les pages qui sont 
relativement moins fiables (car moins populaires). 

1 5 Aprfes une premiere iteration, dans les pages citantes le systeme peut 

• reperer les regions contenant des liens diriges sur des pages de R** ayant un bon score 

• et commencer deja a elaguer les liens qui ne sont pas situes dans ces regions. 

Comme les liens en question se trouvent places sous des noeuds d'une structure typiquement 
arborescente de document (tel qif en HTML notamment), pour determiner une region de 
20 pertinence il suffit de prendre les nceuds (minimaux) qui englobent tous les bons liens et de leur 
retrancher les sous-nceuds (maximaux) qui contiennent un mauvais Hen (score trop faible, ou 
URI explicitement refos6) et qui ne contiennent pas de bon lien (score suffisant). 

L'algorithme permet, ayant un ensemble homogfene (ayant une homogeneite suffisante) d'URIs 
associe a des pages proches, d'obtenir une liste d'URIs de pages qui sont pertinentes 
25 relativement a cet ensemble. II sera decrit plus loin comment exploiter cet algorithme pour 
obtenir un ensemble de pages pertinentes pour un ensemble inhomogene. 

En entree, cet algorithme prend 

• un ensemble K d'URIs de reference (« Kernel ») 
30 • un ensemble A d'URIs candidats (« Authorite ») 

• un ensemble H d'URIs candidats pivots (« Hub » ou « Pivot » en fran?ais) 

• un ensemble T d'URIs a refuser (« Trash ») 



44 Rappelons qu'il s'agit ici de scores de pertinence par rapport a la requete, contrairement de Pdtat de la technique 
qui permet de determiner un score de quality « dans Pabsolu ». 

* Noter que le calcul du score de pertinence d'une page de R"* peut resulter en une valeur negative (que Ton va alors 
neutraliser ; ceci est ddcrit plus loin). En effet, certaines pages peuvent etre, non seulement pas proches de la requete, 
mais mdme antagonistes par rapport a elle (le fait d'y Stre interess6 diminue les chances d' aimer les pages de la 
requite et inversement). 
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On a: AT" cHcA'et Tr\K=0.(E etant un ensemble d'URIs, E" = |J B{P, ) et E + 

P,eE 

1 . Associer a chaque page />/ de if, un nombre h h mis initialement a^-r , son score pivot 46 . 

2. (Re-)calculer les scores autorite : 

5 a. Pour chaque page de A, en commen9ant par celles de K, associer un nombre a b 

Z{0 s*il n'ya pas de lien entre Pj et P k 
l u -h f , oil l n = \ 
j J J J [l s f ily a un lien entre PjetPj 

b. Une optimisation possible mais dangereuse : si, pour certaines pages, a f est 

suffisarnment proche de sa valeur calculee prec£demment (le cas echeant), <et que les scores 
autorite des pages de K n'ont pas varie non plus, nous pouvons garder Tancienne valeur de n 
1 0 pour cette page, pour economiser les calculs. 

3. (Re-)calculer les scores de pertinence : 

a. Pour chaque page P f de A calculer r*, egal a w.^ K 

K = 

15 et dans le cas ou le r6sultat est negatif (cas d'une page antagoniste a R) neutraliser les liens 
entrants de maniere a avoir r* = 0 . 

L'homogen6it6 par l'amont ws d'un ensemble S est defmie comme suit: 



PcS 

\ P contient un nombre pair de pages 
i sinon 



Tp [+lsi: 



20 ■ a p ^A^hjljp oil 

J 

A est une constante arbitraire inferieure mais proche de 1 (elle sert a eviter des divisions par z6ro 
mais ne change pas le principe de Talgorithme. Si l'ensemble H est plus grand que K" alors cette 
constante peut etre egale a un 



+ lsi3P,. eP \l Jt =+1 
0 sinon 



Ainsi, avantageusement, la somme des |H| scores ft, est egale a 1. 
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avec / 



0 s ! il n r y a pas de lien entre Pj et P, 

4 

1 s'il y a un lien entre Pj et P f 



En d'autres termes, l JP est 6gal a 1 sMl y a un lien 

• d ' une page Pj (de H) 

• a au moins une page P t deP 
et zero sinon. 

Ceci signifie tout simplement que ay est le total des scores pivot des pages (de H) qui pointent 
sur au moins une page de P (P 6tant le sous-ensemble courant de S qui est consid^re). 

Pour chaque lien existant on peut lui associer un poids enfonction de la proximite des pages 
Pi et Pj et ameliorer ainsi le resultat - voir plus loin. 



Ici, puisque VP, e K on a r f + = w K (la pertinence est la meme pour toutes les pages Pi de K), ie 
score de pertinence r* ne doit etre calculee qu'une seule fois pour les pages de K (elle sera 
d'ailleurs d€]h calculee Jors de la procedure de d^coupage de la requete R en sous-requetes 
(noyaux) K 9 et sera done d£ja connue a I' entree de la procedure). 

b. (Ce point sera saut6 la premiere fois.) Pour avoir leur somme 6gal a 1, on doit 



diviser chaque r* par la somme ^ r, + de toutes les valeurs absolues des r*. Soit 



Si 6<e (8>0 &ant une marge d'erreur), on considere avoir converge et le procede s'arrete. Sinon, 
le procede continue. 




+ 




la variation globale du score de pertinence. 



+ 



On remplace r\ par 



c. 




+ 




on peut aussi utiliser un facteur de frottement r : 



+ 



(re [0;l[, on prendra de preference une valeur tr&s petite e.g. 0.01 pour que 




dans les cas ou ce n'est pas n£cessaire le nombre d'iterations ne change pas) 
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4. 47 Pour chaque page P/ de # : 

a - Trouver tous les liens qui pointent sur une page ayant un score de pertinence plus 

grand qu'un seuil epsilon k choisir ( e>0 ). 

b. Trouver I h le plus petit Stement HTML 48 contenant la totality des liens trouves au 

point a ci-dessus. 

c - Pour chaque lien pointant sur une page de T (si T n'est pas vide), trouver le plus 

grand element HTML le contenant (s'il y en a) et ne contenant pas de lien trouve au point a. ci- 
dessus, et Penlever de 

d - On garde tous les liens restant dans // et on supprime les autres (ou bien on les 

neutralise en mettant leur l tJ k zero) 



5 . Recalculer les scores pivot: 

a - Pour chaque page jP/ de H, calculerft,* = £/, y r y , la somme des scores de 

J 

pertinence des pages pointees. 

(La division par est > comme pour le score de pertinence, pour garder leur somme egale a 

1). 



Ensuite retourner au point 2. 

Initialement, pour ne traiter qu'un nombre reduit de pages, les scores de pertinence peuvent Stre 
calculus sur la base de R~ (si on avait pris H=R~). Ceci ne sera alors qu'une approximation. En 
effet, pour que les scores soient corrects, il faudrait les calculer en se basant plutot sur H=K*~. 
Mais comme la constitution de R'*' est relativement couteuse, on ne prendra qu'un sous- 
ensemble : on prendra pour K*~ seulement les pages pointant sur les pages de A qui ont un bon 
score. 

Ainsi 49 , on va ajouter une sous-etape avant la fin de P£tape 2.a : 

2.a.L Dans ie cas oil le score r? de la page courante (P f de A) est suffisant 50 , on recalcule r* 
apres avoir ins6r6 dans H les nouvelles pages de B(P$ 



47 Ce point peut eventuellement 6tre ignore* apres la premiere fois. 

48 (ou autre representation analogue.. .) 

Plusieurs m&hodes peuvent etre utilises ; nous presentons ici la preTere'e. 

(c'est-a-dire supeneur a un seuil choisi ; ce seuil pourra etre fonction de Ja cardinality courante de H , en effet plus 
on se rapproche de K*~ (e.g. H^,) plus le score calcule* a des chances d'etre deja correct) 
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On introduit un score autorite pour les pages de A et liquation r* est r = w tKjK a,(plutdt que 
r " w fu/c )• Le nouveau coefficient a, permettra d'affaiblir les pages peu fiables (par Ie fait qu'ils 
5 sont peu populaires). En outre, 1 'equation sera plus coherente dans la mesure ou le score 
pertinence ne sera plus le mSme pour toutes les pages de la requete. 

La procedure est maintenant la suivante : 

1. Ce point est le meme que celui de 1'algorithme de calcul de scores de pertinence presents 
plushaut. 

10 2. Ce point ne change pas non plus. 

3. (Re-)calculer les scores de pertinence : 

a - Pour chaque page i>, de A calculer r? 9 egal a w iKjK • a f et dans le cas ou le r6sultat 

est negatif (cas d'une page antagoniste a K) neutraliser les liens entrants de mantere a avoir 
r* = 0. 

15 b. Poursuivre a partir du point 3.b de l'algorithme de calcul de scores de pertinence 

presente pr^cedemment. 



Filtrage : 

Pour chaque lien lji existant on peut lui associer un poids en fonction de la proximite des pages Pi 
20 et Pj et ameliorer ainsi le resultat. Cela permet de diminuer 1'importance des liens entre pages qui 
se promeuvent mutuellement. Typiquement on arrive ainsi a filtrer par exemple les liens des 
« sommaires » et autres « menus » qui, de maniere repetitive, se trouvent dans toutes les pages 
d'un site. 

L'idee de base consiste a affaiblir les liens reliant deux pages que nous savons proches, en 
25 affectant un poids a chaque lien, poids qui sera egal au complement de la proximite des deux 
pages relives (plus la proximite est grande, plus le lien doit etre affaibli). Une fois que les liens 
sont ainsi ponder6s, il est possible de calculer l'homogen£ite d'un ensemble de pages en utilisant 
non plus le nombre de pages citantes, mais la somme de leurs poids. 

Au point 3. a de l'algorithme, on remplace dans la definition de du score autorite ^hjl JP par 

J 




Explications : 



• l J{ -x Jf est le complement de la proximite entre la page Pj et la page P,* s'il y a un lien 

de la page Pj a la page P,- , et zero sinon 
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• max(/ y/ • x Y ) est le complement de la proximity entre la page P t e H en question et la 
page P i e P pour laquelle le lien entre P } et P f presente la proximite minimum 

• minj^l; msa^, -x y/ )j signifie que cette valeur est tronqu£e sup^rieurement a 1 

f 0 s'il n 1 y a pas de lien entre P. et P. 

• et toujours l ff =< . 

J [1 s f il y a un lien entre Pj et P- 

5 En d'autres termes, s'il y a au moins un lien 

• de la page Pj (de H) en question 

• a une page P t de P, 

£ JP est egal au complement de la proximity entre la page Pj et la page P,» qui lui est la moins 

proche et vers laquelle elle possede un lien. JF est la somme des poids ainsi assoctes aux 

' . j 

10 pages de H qui pointent sur au moins une des pages du sous-ensemble P considere. 



Pour determiner la proximite x Jt , on peut prendre Pequation de quantite de raisons communes 

(dejadecrite): ^ = JU^J=L 
P a ' Pab 

15 La figure 6 presente un exemple oil le nombre de pages pointant sur la page A est egal a 
O.9+O.2+O4+0. 5-2.3 

Le nombre de pages pointant sur la page B est egal a 0^+0.7+0.3+0.5=1.8 

Le nombre de pages pointant sur A ou B (N p AB ) est Sgal a 0.9+0.2+09+0.5+03+0.5=3.6 

Ainsi, si on considere que \H\ + h = 100 , le calcul de la proximite de A et B donne : 

20 7^ = = 0 '! 7 !'°;! 82 . ce qui donne x AB = * 0.264 = 26.4% . 

P.- Pab 1-0.964 p B 

Le filtrage decrit ci-dessus utilise un poids x j{ . Puisque nous avons maintenant les scores 51 des 
pages citantes, nous pouvons optionnellement am61iorer le procede en prenant x M - JTj comme 

poids (au lieu de x Jf ), ou hj est le score de la page citante (affaiblir un lien (d'une page citante 
Pj a une page citee Pj) davantage quand le score de la page citante Pj est faible. 

25 II est a noter que pour calculer la proximite x Jt entre deux pages P t et Pj reliees, au lieu d'utiliser 
l'equation de quantite de raisons comme illustre ci-dessus, on peut effectuer le rapport entre : 



(que ce soit de maniere absolue ou par rapport a la requSte) 
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- la cardinality de F ensemble des pages qui pointent vers P, ET P } 

- et la cardinality de 1' ensemble des pages qui pointent vers P f OU Pj . 
Determination des sous-ensemble homog&nes d'une requSte : 

On fournit au syst&me un ensemble R de pages et 6ventuellement un ensemble de pages Rx de 
5 pages qu'on ne veut explicitement pas (RniR x = 0). Le syst&ne va identifier au sein de R au 
moins un groupe de pages « homogene » et va lancer une sous-requete s£paree sur ce ou chaque 
groupe. Ces groupes sont appelles « kernel » (ou noyau). Pour former la reponse on prendra 
ensuite une combinaison des scores obtenus. Ce proc&te comprend ainsi les etapes suivantes : 

1 . Pour chaque page P t de R, trouver B(Pj), l'ensemble de pages citant P t . 
10 2. Trouver R" = (Ji?^,), 1 'ensemble de pages citant au moins une page de R. 

P ( eR 

3. Dans les pages de R qui ne sont pas encore dans un noyau (au debut aucune ne Test), 
trouver la page P B ayant le plus grand ensemble B(Pb) de liens entrants 52 , et creer un noyau 
contenant seulement cette page. Ce noyau est maintenant Kc, le noyau courant en construction (a 
tout instant il n'y en a qu'un seul). Si toutes les pages se trouvaient dans au moins un noyau alors 

1 5 passer au point six . 

4. Trouver les pages pertinentes par rapport a Kc (en utilisant Talgorithme de calcul de 
scores de pertinence) avec 

o H=K 

o 4=R 

20 o K=K C 

o T=R X 

5. Soit Pn la page de R, pas encore dans Kc, qui a le score de pertinence le plus eleve. Si 
son score de pertinence est inferieur a un score minimal fixe, retourner au point trois. (le noyau 
courant est maintenant complet). Sinon Tinserer dans Kc et repasser au point quatre. A noter 

25 qu'il ne sera pas necessaire de reinitialiser les scores pivot et autorite, il est preferable de garder 
les dernieres valeurs calculees, ainsi la convergence devrait Stre tres rapide. 

6. On a maintenant un ensemble de noyaux (sous-requ§tes homogenes par l'amont) prStes a 
etre utilis^es comme decrit dans ce document. Lorsqu'on veut calculer les scores de pertinence 
globalement a toute la requSte on fait une moyenne arithmetique des resultats pour chacun des 

30 noyaux. 



En variante, au lieu de se baser sur liquation d'homogen^ite x s = Y\p P comme decrit 
jusqu'ici, le procede de calcul de scores de pertinence peut etre base sur une autre Equation 



Dans le cas ou on a les scores autorite des pages, ou autre score de popularity on pr^fere se baser plutdt sur eux. 



WO 03/057648 



PCT/FR03/00089 



38 



d 'homogeneity comme par exemple x s = 



P,eS ' 



ou encore x s = 



P,eS p t eS 

dans lesquelles les cardinalites d'ensemble (representees entre barres verticales) sont remplac^es 
par le total des scores pivot des pages en question 53 . 



P,eS 



(Min\B<P,)\\ 

P,eS 

Max\B(P,)\ 



5 Traitement par 1 ' aval : 

Au lieu de chercher les bonnes pages relativement a celles d'un noyau parmi les pages qui sont 
citees en commun avec e'Hes il peut etre interessant d'effectuer les memes algorithmes dans 
Pautre sens, i.e. en cherchant parrni les pages qui citent les mSmes pages que le noyau, voire 
meme d'effectuer les deux et de calculer une rnoyenne arithmetique. 

10 Les algorithmes par Paval sont identiques a ceux par Pamont sauf que B est remplace par F et F 
est remplac^ par B, et " est interverti avec * (par exemple R' + est remplace par J? + > 

Les proc^des par Pamont et par Paval peuvent etre avantageusement integres de la maniere 
suivante : Apres le traitement par Pamont (6ventuellement meme apres chaque iteration amont), 
aux pages candidates (R"*) ayant obtenu un score de pertinence suffisant, on associe a Paval un 
15 ensemble de pages supplementaires (« pages artificielles ») dont la cardinality est fonction dudit 
score de pertinence. Chaque page artificielle est aussi citee par (au moins) une page de la requete. 
On donne ainsi k Paval un « avantage » aux scores de ces bonnes pages (de R" + ) trouvees par 
Pamont 54 , et par consequent on donne aussi indirectement un avantage aux scores des pages (de 
cities le cas echeant par ces bonnes pages. 

20 Et reciproquement, aprds le traitement par Paval (£ventuellement meme apr^s chaque iteration 
aval), on applique a Pamont le mSme proced^ de maniere symetrique. On favorise ainsi les 
bonnes pages de R + ~ et indirectement les pages (de 2?~ + ") qui les citent le cas echeant. 

Le fait de ne pas amalgamer les scores par Pamont (des pages R' + ) avec les scores par Paval 
(pages R + ~) permet de les dissocier dans les calculs. Notamment, on peut diminuer Pinfluence 
25 des scores obtenus par Paval dans les traitements par Pamont ou vice-versa. 

Par ailleurs, grace a cette id^e de « pages artificielles », le present procedS peut etre appliquee en 
complement aux methodes existantes dans Petat de la technique. En effet, une fois les scores 
obtenus pour chaque page, on peut modifier artificiellement les nombres respectifs des pages 
citantes et cities avant d'appliquer ces methodes. 

30 On peut arpenter (« crawling » en terminologie anglo-saxonne) le Web en suivant les liens (en 
amont et en aval) autour des pages des 7 ensembles prdcedemment cities, en tirant parti de 
Pajout des pages artificielles pour avantager les pages Web H6es aux pages qui sont plus 
pertinentes par rapport a la requete. 

Dans la mesure oil les pages ayant les meilleurs scores sont censees etre trds pertinentes pour 
35 Putilisateur (et dans la mesure ou la pertinence est transitive), les proc6d£s d£crits ici pourront 



On peut dire que Ton remplace les cardinalites par des « cardinalites pond^res », les poids &ant les scores hub. 
Noter que, avantageusement, ceci se fait sans amalgamer les scores de pertinence par Pamont et par Taval. 
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etre r^cursivement appliques sur ces derni&res pour d^couvrir encore d'autres pages pertinentes. 
On peut ainsi arpenter le Web k partir de la requete de Putilisateur. 

La figure 7 presente de mantere sch^matique un tel proc&te : la recherche de pages pertinentes 
peut Stre appliquee recursivement en Pendant la requete avec les « Bonnes pages trouvees par 
5 Pamont», « Bonnes pages trouvees par Paval », « Bonnes pages pivot » et « Bonnes pages 
autorites » qui dans la figure sont encadr^s par des rectangles. A chaque recursion, les scores des 
meilleures pages trouvees deviennent un peu plus faibles (par le fait que les meilleures pages 
trouvees sont k chaque fois ajoutees dans la requete) et le proced£ s'arrete quand les scores 
cessent d'etre suffisants. 

Un systeme mettant en oeuvre le procede de distillation relative decrit ci-dessus est apte a 
recevoir une requSte de recherche composee d'un ensemble d'URI permettant d'acc&Ier a des 
ressources d' information telles que des pages Web et fournir en rgponse les URI (ou directement 
les pages) qui sont censes etre les plus pertinents par rapport a ladite requdte . 

La requete peut par exemple etre constitute des liens favoris de Putilisateur, le but du systeme 
6tant par exemple de surveiller le Web autour de ces liens et de notifler Putilisateur quand de 
nouvelles pages int6ressantes y apparaissent, soit en technologie « Push » k ^initiative d'un 
serveur, soit en technologie « Pull » a ('initiative de rutilisateur. 

L'utilisateur peut bien sur directement fournir au systeme un ensemble d'URI, neanmoins, 
d'autres moyens peuvent aussi lui etre offerts pour Passister dans la preparation et la soumission 
d'une requete de recherche. 

Pour declencher Pextcution d'une requete de recherche a partir d'un lien hypertexte se trouvant 
dans une page, l'utilisateur peut utiliser Pun quelconque des dispositifs parmi les suivants : 

• Un objet graphique activable par exemple par clic (e.g. un bouton) est present^ a proximite 
de certains liens hypertextes (URI) dans une page Web. Son activation d6clenche P envoi d'une 

25 requSte de recherche contenant PURI en question. 

• Le systeme est dote d'un moyen apte k basculer la page dans un etat ou chaque clic sur un 
lien dtclenche Pexecution d'une requete de recherche (contenant ce lien). 

• Une touche du clavier, telle que la touche « Ctrl », appuyte alors que Pon clique (par un 
moyen de pointage) sert a declencher Pexecution d'une requete de recherche a partir du lien sur 

30 lequel curseur du moyen de pointage est position^. 

• Le bouton droit de la souris (ou equivalent) sert k declencher Pexecution d'une requSte de 
recherche a partir du lien sur lequel le curseur de la souris est positionne. 

• Autre dispositif analogue. 

Chacun de ces dispositif peut avantageusement permettre d'executer ladite requSte de recherche 
35 en plus de (en paraltele k) Pacces a la page designee par le lien en question. Le resultat de la 
requdte de recherche sera par exemple affich6 dans une deuxieme fenetre (nouvelle instance du 
navigateur) ou encore dans une sous-fenetre du navigateur 55 . 



De maniere analogue a la sous-fen€tre existante aujourd'hui pour les liens favoris, cette sous-fenStre peut etre 
adjacente a la sous-fenetre principale dans laquelle Stait affichee la page contenant le lien que l'utilisateur a cliqu6 et 
dans laquelle est ensuite affichee la page acc&iee par le fait de cliquer sur ce Hen. 
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En supplement du lien seiectionne, d'autres URI peuvent Stre ajoutes d'office dans la requete de 
recherche 56 , Ceux-ci peuvent notamment etre: 

• les liens se trouvant dans la page, dans la region de 1'URI seiectionne ; 

• les URI pr^cedemment selectionnes par l'utilisateur pour cette meme requete au cours de sa 
5 navigation 57 ; 

• des liens explicitement prevus et de preference determines par le concepteur de la page pour 
accompagner l'URI selectionne ; 

• les URI qu'un autre utilisateur (« mentor » ou referent) considere comme etant tres pertinents 
par rapport a FURI selectionn^ le mentor etant determine automatiquement par le systeme, ou 

10 specific par l'utilisateur lui-m§me (choisit dans une liste de «copains» qu'il a au pr£alable 
memorisee dans le systeme), ou encore propose par le concepteur de la page (l'utilisateur peut 
aussi choisir dans une liste d' « experts » proposes par le concepteur de la page). 

Preparation d'une requete : 

On va maintenant decrire comment Putilisateur peut preparer une requete composee de plusieurs 
1 5 liens qu'il glane au cours de sa navigation. 

a) Affichage de la requete courante en preparation 

Au lieu de declencher directement une requete de recherche, Paction de I' utilisateur (comme 
decrit plus haut, par exemple le fait de cliquer sur un lien avec le bouton droit et choisir l'option 
appropriee) declenche 1'affichage d'une page accessoire dans laquelle : 

20 • en plus du lien que l'utilisateur vient de seiectionner 58 , d'autres liens, qu'il a le cas 6cheant 
precedemment selectionnes pour cette meme requete, sont presentes ; 

o des cases a cocher peuvent etre affichees en association avec chaque lien presente, de 

maniere a ce que l'utilisateur puisse notamment seiectionner ceux qui vont effectivement former 
la requete; 

25 • ladite page accessoire est aussi munie d'un moyen d'entree (tel qu'un bouton) permettant de 
lancer la requSte de recherche. 

Ainsi l'utilisateur peut preparer une reguete progressivement, en seiectionnant des liens les uns 
apres les autres 59 lors de sa navigation et ensuite envoyer une requSte composee de plusieurs 
URI. 

30 Ladite page accessoire peut en plus contenir des objets graphiques depliables (comme par 
exemple des repertoires, casiers, dossiers, ou metaphore analogue) representant des requetes en 
preparation autres que la requete en cours. L'utilisateur peut ainsi choisir la (ou les) requete qui 
sera enrichie par le nouveau lien qu'il vient de seiectionner. 



56 En efFet, un des avantages essentiels du systeme est de pouvoir fonctionner (trouver les ressources d' information 
pertinentes) m6me si la requete de recherche est composee d'une plurality d'URI. 

Les nouveaux URI trouv6s par le systeme sont alors mis en evidence dans le resultat retourne* a l'utilisateur (pour 
les distinguer des URI qui avaient deja et^ retoumes dans la meme navigation). 

58 (ainsi que des liens ajoutes d'office, le cas echeant, comme decrit ci-avant) 

59 (dans une meme page ou dans des pages differentes) 

60 (lors d'une meme navigation ou de maniere plus espacee dans le temps) 
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Suite k la preparation d'une requete a partir d'un URI correspondant a un lien hypertexte dans 
une page (comme decrit plus haut), les requetes dejk existantes qui le cas echeant contiennent cet 
URI lui sont optionnellement presentees. 

Avantageusement, ladite page accessoire peut etre composee de deux parties. L'une de ces 
5 parties contient les elements decrits ci-dessus (c'est-a-dire les elements de la requete en 
preparation). L'autre partie presente le contenu de la page designee par le lien seiectionne par 
1'utilisateur. 

Par exemple, si 1'utilisateur clique sur un lien alors que la page est a l'etat ou tous les clics 
declenchent Paffichage de la requete courante en preparation (ou avec le bouton droit de la 
10 souris, etc), le serveur lui retourne ladite page accessoire qui comprend ainsi : 

• dans une partie : les elements de la requete en preparation 

• et dans Tautre partie : le contenu de la page designee par le lien clique. 

Ainsi, le fait d'utiliser le systeme represente un avantage important par rapport k la navigation 
classique sur le Web : 1'utilisateur re9oit non seulement la page designee par le lien qu'il a clique 
15 (c'est la navigation classique sur le Web), mais en meme temps il beneficie de la possibilite 
d'envoyer une requete (contenant plusieurs URI) pour obtenir encore d'autres ressources 
pertinentes en relation avec cette page. 

En variante, ladite page accessoire est retoumee apres une execution rapide (voire restreinte 61 ) de 
la requete de recherche en cours k laquelle le lien clique k &6 ajoute. La deuxteme page contient 
20 alors directement une partie du resultat 62 . L'utilisateur re?oit alors non seulement la page 
designee par le lien quMl a clique, mais en plus il beneficie directement d'autres ressources 
pertinentes en relation avec cette page. 

Plus avantageusement encore, ladite page accessoire peut etre affichee dans une sous-fenetre 63 
adjacente a la sous-fenetre principale du navigateur. Cette sous-fenetre adjacente s'ouvre en 
25 reponse a Taction de Tutilisateur qui souhaite Taffichage de la requete en preparation (c'est-a- 
dire ladite page accessoire). 64 

La requgte en preparation peut ainsi etre affichee en parall&le (de maniere asynchrone) a 
Taffichage de la page designee par le lien clique; cette derniere s'affichant (independamment) 
dans la sous-fen§tre principale. 
30 Le resultat de la requete de recherche peut ensuite etre presente dans la meme sous-fenetre 
adjacente. 

Comme mentionne precedemment, un resultat (partiel) peut eventuellement etre retourne aprfes 
execution partielle ou restreinte de la requete de recherche en cours, requSte a laquelle le lien 
clique a ete ajoute. La sous-fenetre adjacente presente alors directement un resultat rapide de 
35 recherche (qui sera 6ventuellement complete par la suite). 



61 Dans le cas d'une requete sur des pages deja crawlees, le systeme peut directement retourner les URI (ou pages) 
pertinents deja connus et retourner la suite des resultats en differe. 

* 2 (par exemple sous forme d'une liste d'URI ou un ensemble de vignettes representant ces pages en miniature) 

63 (analogue a la sous-fenetre des liens favoris des navigateurs actuels) 

64 Noter que, en parallele a Taffichage de la requite en preparation, le serveur peut avantageusement deja ^ 
commencer a arpenter le Web (crawling en terminologie anglo-saxonne) -c'est-a-dire constituer iT, iT*", K*~, R*, R 
et R** comme deja d^crit- autour du lien seiectionne. 
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b) RSsultat de l'execution d'une requSte de recherche 

Pour chaque requete de recherche, le serveur peut retoumer les resultats directement (par 
exemple en retour de la requete HTTP) ou en diff<§r<§ (par exemple par email), 

Le serveur retourne les URI (resultant d'une requete) dans une page pr^sentant la mSme structure 
5 que ladite page accessoire (ou Iadite requete en preparation), a savoir : 

• des cases a cocher sont associees aux liens de mantere a ce que l'utiltsateur puisse 
s^lectionner ceux qu'il apprScie et supprimer ceux qu'il n'appnJcie pas 65 

o chaque URI 66 peut ainsi etre dans au moins Tun des etats suivants 67 : sugg<§re (etat par 

d^faut), accepte ou supprimS (les URI qui sont a l'<§tat supprime ne sont pas pr&entes); 

10 • la page est munie d'un moyen d' entree (tel qu'un bouton) permettant de relancer la requete 
de recherche. 

La page retoumde presente egalement les autres requetes (du meme utilisateur) sous forme 
d'objets graphiques depliables, comme d6ja decrit. La presentation de celles-ci peut etre 
hierarchisee selon leur pertinence par rapport au lien cliqu6 (selon les proc6d6s de calcul de 

1 5 pertinence decrits plus loin) . 

La page retournSe pr6sente des moyens de commande permettant h l'utilisateur de creer de 
nouvelles requetes et supprimer des requetes existantes. Bien entendu, l'utilisateur peut copier- 
coller des URI a partir de requetes existantes ou de n'importe quelle autre ressource. Et lorsque 
le resultat d'une requSte est retourn^ par le serveur, l'utilisateur peut deplacer (ventiler) les URI 

20 rectus dans d' autres requdtes. Chaque requete est accessible individual lement au moyen d'un URI 
qui lui est propre. 

Maintenance des spots 

On a decrit jusqu'ici plusieurs proc^des qui utilisent la methode de distillation relative, en partant 
25 d'une requete (e.g. les liens associes donnas d'un spot) compos<£e d'un ensemble d'URI, pour 
determiner et memoriser des URI pertinents (e.g. les liens associes completes d'un spot) par 
rapport a cette requete, avec leurs scores de pertinence. Ces resultats memorises sont^obtenus sur 
la base de comptage de liens se trouvant dans les ressources des ensembles iT + , R~ , R' ~,R ~, 
# + " + , R + - + ~ 9 6B etc. qui sont eux-mSmes memorises du moins en partie. Or ces ensembles varient 
30 dans le temps (et les liens se trouvant dans les ressources constituant ces ensembles varient 
aussi). II faut done tenir k jour les donnSes memorises et refaire les calculs quand les donn^es 
qu'ils prennent en entree varient de maniere significative. 

Par ailleurs, il est souhaitable de deceler de nouvelles ressources pertinentes avant meme que des 
liens pointant vers elles n'apparaissent sur le Web. On va maintenant dgcrire un proc&te 
35 permettant de le faire. 



65 (e'est-a-dire demander au systeme de ne plus les suggerer) 

66 Optionnellement, la presentation du resultat d'une requete de recherche inclut le contenu des pages (pointees par 
les URI resultants) par exemple sous forme miniaturisee (vignettes). 

67 Accessoirement, une possibility de copie (« gel ») de page (en local ou dans un espace personnel sur un serveur) 
peut aussi etre offert a l'utilisateur. Chaque lien peut alors etre dans un des &ats suivants : sugg6re\ accepte, 
supprime ou gel 6. 

68 K*~, J R + ~ et R*' + 'sont notamment utilises pour calculer la proximite de ressources liees, et filtrer, comme decrit 
plus haut, en prenant le complement de cette proximite comme ponderation du comptage des liens en question. 
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Pour chaque requete (par exemple pour chaque spot), 

- selectionner un premier ensemble de ressources ayant les plus grands scores de pertinence (tels 
que les plus grands scores pivots) pour ladite requete 

- determiner les regions pertinentes (c'est-a-dire les regions possedant des liens vers des 
5 ressources dont les scores sont elev6s en moyenne) dudit premier ensemble de ressources ayant 

les plus grands scores de pertinence, 

- surveiller les nouveaux liens qui apparaissent dans lesdites regions pertinentes et qui pointent 
vers de nouvelles ressources (c'est-&-dire vers des ressources qui n'etaient pas encore connues du 
systeme), 

10 - selectionner un deuxieme ensemble de ressources ayant un score de pertinence (tel que le score 
autorite) eieve pour ladite requete, 

- selectionner les nouvelles ressources qui sont les plus similaires aux ressources dudit deuxieme 
ensemble de ressources et donner aux nouvelles ressources seiectionnees un score autorite 
dependant du temps (comme decrit ci-apr&s) en fonction de teur similarite aux ressources dudit 

15 deuxieme ensemble de ressources. 

La similarity d'une ressource par rapport k d'autres ressources est determinee en comparant leurs 
contenus. On decrit ci-apres comment determiner la similarite en fonction de la distribution des 
mots dans les ressources en question. 

Score autorite dependant du temps : 

20 Chaque nouvelle ressource autorite a un score autorite hypertexte (a h t) et un score autorite 
similarite (a s ). Soit x le rapport entre 

- le temps restant pour que la ressource en question ne soit plus consideree comme etant nouvelle 

- et la duree totale de nouveaute (c f est-a-dire la duree totale pendant laquelle une ressource qui 
vient d'etre decouverte par le systeme est consideree comme nouvelle). 

25 x est done un nombre egal a 1 au debut de la vie d'une ressource dans le systeme, et decroit 
lineairement jusqu'a atteindre 0 au moment ou Ton dit que la ressource en question est vieille.. 

Ainsi x est utilise comme une ponderation pour passer progresi vement d'un score similarite k un 
score hypertexte et la formule du score global est |a = Ta s +r'aJ (avec x'=l-x). 

Comme la distribution des mots d'une nouvelle ressource varie en principe moins que les liens 
30 hypertextes qui pointent vers elle, on considere que a s est constant tandis que a h t doit etre mise k 
jour dans le temps. Ainsi le score a s doit etre calcuie au moment ou la nouvelle ressource est 
decouverte, et pour toutes les requetes pour lesquelles elle est dans une region pertinente, jusqu'a 
qu'elle devienne vieille (ainsi si un lien vers cette ressource apparait dans une region pertinente 
aprds qu'elle soit devenue vieille, alors on ne determinera pas sa similarite avec les ressources 
35 dudit deuxieme ensemble). 

Similarite : 

On va utiliser un algorithme de distillation absolue pour determiner le score a s de chaque 
nouvelle ressource. 

Le procede connu de distillation absolue sur un ensemble de noeuds relies par des liens (formant 
40 ainsi un graphe oriente) comprend les etapes suivantes : 
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1- a chaque noeud attribuer un score pivot 6gal k 1 ainsi qu'un score autorite, 

2- pour chaque noeud calculer son score autorite en additionnant les scores pivots des nceuds qui 
pointent vers lui, ensuite normaliser les scores autorit£s de maniere a ce que leur total soit egal k 
1, 

5 3- pour chaque noeud calculer son score pivot en additionnant les scores autorit6s des nceuds vers 
lesquels il pointe, ensuite normaliser les scores pivots de mantere a ce que leur total soit 6gal k 1, 

4- it&er en reprenant a partir de 1'ftape 2 jusqu'a que Talgorithme converge, c'est^a-dire jusqu'a 
ce que les scores ne soient plus significativement differents par rapport a l'gtape prec6dente. 

Ici les liens sont en plus ponderes par les similarity des ressources en question par rapport a la 
10 distribution de leurs mots. Les Stapes 2 et 3 sont remplacees par les suivantes : 

2 5 - pour chaque noeud calculer son score autorite en additionnant les scores pivots des nceuds qui 
pointent vers lui multiplies par le poids des liens respectifs, ensuite normaliser les scores 
autorit6s de maniere a ce que leur total soit 6gal a 1, 

3*- pour chaque noeud calculer son score pivot en additionnant les scores autorit^s des nceuds 
15 vers lesquels il pointe multiplies par le poids des liens respectifs, ensuite normaliser les scores 
pivots de maniere a ce que leur total soit 6gal a 1, 

Le poids du lien de similarity entre deux ressources est egal au produit scalaire de leurs 
distributions de mots (c'est-^-dire k la somme, pour chaque mot qui se trouve dans les deux 
ressources, du produit des frequences de ce mot dans ces ressources ; la somme r£sultante est un 
20 nombre entre zero - cas ou il n'y a aucun mot en commun - et 1 - cas ou les deux ressources on 
le merne contenu) apres avoir ote les mots non significatifs (« stop words » en terminologie 
anglo-saxonne). 

II est a noter que les liens de similarite ainsi obtenus sont bidirectionnels. 
Ainsi, on peut ainsi effectuer la distillation absolue, sur 1 'ensemble des ressources comprenant : 
25 - la nouvelle ressource d6couverte, 

- et ledit deuxieme ensemble de ressources ayant des scores de pertinence eleves, 
pour determiner le score a s de cette nouvelle ressource decouverte. 

Les procedes decrits ci-dessus permettent ^galement de selectionner, parmi un ensemble de 
ressources supplementaires, une ressource qui est la plus pertinente par rapport a une ressource 
30 de depart 

A cet effet, on met en ceuvre les trois etapes suivantes : 

(a) selection dans le Web de ressources les plus similaires a la ressource de depart (typiquement 
une ressource privSe), par Tune des methodes de l'invention, 

(b) selection dans le Web de ressources les plus pertinentes par rapport aux ressources 
35 s&ectionnees a 1'etape (a), et 

(c) selection de ressources suppldmentaires (typiquement des ressources privees k nouveau) les 
plus similaires aux ressources les plus pertinentes selectionn6es k P6tape (b). 

Un tel proced^ permet notamment de g6n6rer dynamiquement le contenu de pages Web publiees 
en fonction du contexte. 
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REVENDICATIONS 

1. Procede pour determiner des ressources additionnelles pertinentes par rapport k un 
ensemble donnt de ressources de depart, caracttrise en ce qu'il comprend les Stapes suivantes : 

5 a) identifier un ensemble de ressources citantes constitutes par toutes les ressources ayant 

■un lien vers au moins Pune des ressources de depart, 

b) former un ensemble de ressources candidates constitut par l'ensemble des ressources 
citees par les ressources citantes, 

c) pour chaque ressource candidate, calculer un score de pertinence de ressource 
10 candidate entre ladite ressource candidate et l'ensemble de ressources de depart sur la base de 

Pexistence de liens situes dans les ressources citantes et diriges vers la ressource candidate et 
vers les ressources de depart, et sur la base egalement de scores de pertinence de ressources 
citantes affectts a chacune des ressources citantes, 

d) pour chaque ressource citante, recalculer un score de pertinence de ressource citante 
15 sur la base de Pexistence, dans la ressource citante en question, de liens vers les ressources 

candidates et sur la base Egalement des scores de pertinence de ressource candidate attributes 
aux ressources candidates a Pttape c), 

e) rtptter le cas echeant Pttape c) et le cas tchtant une ou plusieurs fois Pttape d) puis 
Pttape c) 

20 f) determiner lesdites ressources additionnelles pertinentes comme etant les ressources 

candidates qui prtsentent les meilleurs scores de pertinence de ressource candidate. 

2. Procede selon la revendication 1, caracterist en ce que le calcul de score de pertinence 
effectue k Petape c) comprend le calcul d'une pluralite de sommes de scores de pertinence de 
ressources citantes, chaque somme comprenant uniquement les scores de pertinences des 

25 ressources citantes comprenant un lien vers une ressource donnee constitute par la ressource 
candidate ou une ressource de depart. 

3. Proctde selon la revendication 2, caracterise en ce qu'il comprend egalement le calcul 
d'au moins une somme de scores de pertinence de ressources citantes, chaque somme 
comprenant uniquement les scores de pertinences des ressources citantes comprenant un lien vers 

30 Pune parmi un ensemble d'au moins deux ressources donnees, cet ensemble comprenant la 
ressource candidate et au moins une ressource de depart. 

4. Proctde pour determiner des ressources additionnelles pertinentes par rapport a un 
ensemble donne de ressources de depart, caracttrise en ce qu'il comprend les ttapes suivantes 

a) identifier un ensemble de ressources citees constitutes par toutes les ressources ayant 
35 un lien depuis au moins Pune des ressources de depart, 

b) former un ensemble de ressources candidates constitut par l'ensemble des ressources 
citant les ressources citees, 

c) pour chaque ressource candidate, calculer un score de pertinence de ressource 
candidate entre ladite ressource candidate et l'ensemble de ressources de depart sur la base de 

40 Pexistence de liens situts dans la ressource candidate et dans les ressources de dtpart et dirigts 
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vers les ressources cities, et sur la base Sgalement de scores de pertinence de ressources citees 
affectes a chacune des ressources cities, 

d) pour chaque ressource citee, recalcuier un score de pertinence de ressource citde sur la 
base de 1' existence, dans la ressource cit£e en question, de liens depuis les ressources candidates 

5 et sur la base tgalement des scores de pertinence de ressource candidate attributes aux ressources 
candidates k TStape c), 

e) r£p£ter le cas echtant 1'etape c) et le cas echeant une ou plusieurs fois 1'etape d) puis 
l'&ape c) 

f) determiner lesdites ressources additionnelles pertinentes comme 6tant les ressources 
10 candidates qui presentent les meilleurs scores de pertinence de ressource candidate. 

5. Systeme de navigation parmi des ressources d' information, chaque ressource comprenant 
au moins un lien activable dans un premier mode par un dispositif d 'entree pour provoquer 
I'acc&s k une autre ressource d'informations d£sign£e par un identificateur de ressource associe a 
ce lien, caracterise en ce qu'au moins certaines ressources comprennent au moins un lien 

15 activable dans un second mode a Paide d'un dispositif d' entree pour envoyer & un moteur de 
recherche de nouvelles ressources d'informations une requete de recherche contenant 
P identificateur de ressource associe au lien en question. 

6. Systeme selon la revendication 5, caracterise en ce que le dispositif d'entree est apte a 
activer le lien simultanement dans les premier et second modes. 

20 7. Systeme selon la revendication 5, caracterise en ce que I'activation du lien dans le second 
mode est apte a provoquer l'affichage d'une requete pre-existante, a laquelle Y identificateur de 
ressource associe au lien en question est susceptible d'etre ajoute. 

8. Systeme selon les revendications 6 et 7 prises en combinaison, caracterise en ce que 
I'activation du lien dans le second mode est apte a afficher, en plus de la requete pre-existante, la 

25 ressource d'informations designee par ledit identificateur de ressource. 

9. Systeme de recherche de nouvelles ressources d' information a partir de ressources 
d'informations existantes, caracterise en ce qu'il comprend un moteur de recherche base sur 
l'analyse de liens entre differentes ressources et acceptant en entree une requete comprenant une 
s&rie d'identificateurs de ressources, un moyen de selection d'identificateurs apte a memoriser un 

30 ensemble d'identificateurs (URI) de ressources s61ectionn6s les uns aprds les autres par un 
utilisateur, et un moyen generateur de requete activable par l'utilisateur pour engendrer une 
requete contenant I'ensemble des identificateurs precedemment seiectionnes a destination du 
moteur de recherche. 

10. Systeme selon la revendication 9, caracterise en ce que le moyen de selection est apte a 
35 memoriser les identificateurs s&ectionnes de maniere r^manente, de telle sorte que le moyen de 

selection puisse etre mis en ceuvre de fa?on espacee dans le temps en vue de la generation d'une 
meme requete. 

11. Procede de recherche de nouvelles ressources d' information a partir de ressources 
d'informations existantes, caracterise en ce qu'il comprend la mise en ceuvre d'un moteur de 

40 recherche base sur l'analyse de liens entre differentes ressources et acceptant en entree une 
requete comprenant une s£rie d'identificateurs de ressources et en ce qu'il comprend les etapes 
suivantes : 



WO 03/057648 




PCT/FR03/00089 



47 

- selection d'identificateurs (URI) de ressources les uns apr&s les autres par un 
utilisateur ; 

- generation d'une requete contenant Pensemble des identificateurs prec^demment 
s^lectionnes a destination du moteur de recherche. 

5 12. Procede de recherche de nouvelles ressources d' information k partir de ressources 
d'informations existantes, caracterise en ce qu'il comprend la mise en ceuvre d'un moteur de 
recherche base sur Panalyse de liens entre differentes ressources et acceptant en entree une 
requete comprenant une s6rie d'identificateurs de ressources et en ce qu'il comprend les etapes 
suivantes : 

10 - generation d'une requete contenant un ensemble d'identificateurs de ressources 

prec^demment memorises dans un m§me groupe d'identificateurs de ressources propre a un 
utilisateur, a destination du moteur de recherche, 

- generation d'une signalisation a 1'attention de Putilisateur Jorsqu'au moins un nouvel 
identificateur de ressource appartenant au groupe en question a ete trouve par le moteur. 

15 13. Procede selon la revendication 12, caracterise en ce que chaque groupe d'identificateurs 
de ressources est represent^ par un objet graphique sur un dispositif d'affichage de P utilisateur, 
et en ce que ladite signalisation est realisee au moins par changement d'apparence de cet objet 
graphique. 

14. Proc6d£ de gestion de ressources dans un systdme informatique pourvu d'un ecran 
20 d'affichage et d'un dispositif d'entree pour d^placement et actionnement de curseur tel qu'une 

souris, chaque ressource possedant une representation affichee sur 1' ecran de maniere a pouvoir 
etre deplacee k l'aide du dispositif d'entree, proc6d6 caracteris6 en ce qu'il comprend les etapes 
suivantes : 

- d^placement de la representation d'une premiere ressource pour Pamener au-dessus de 
25 la representation d' une seconde ressource, 

- puis memorisation, dans une memoire de gestion associative de ressources, 
d'informations d'association entre les premiere et deuxieme ressources. 

15. Procede selon la revendication 14, caract£rise en ce que Petape de deplacement est 
effectuee par une technique de glisser-deposer. 

30 16. Procede selon la revendication 14 ou 15, caracterise en ce qu'il comprend en outre, suite 
a P identification d'une ressource donn£e dans un processus de consultation de ressources, les 
etapes suivantes : 

- lecture de la memoire de gestion associative de ressources pour determiner si a ladite 
ressource donnee sont associees d' autres ressources, et 

35 - dans P affirmative, signalisation sur Pecran d'affichage de l'existence de la ou des 

ressources associees. 

17. Procede selon Pune des revendications 14 a 16, caracterise en ce que les ressources 
comprennent des fichiers. 

18. Procede selon Pune des revendications 14 k 17, caracterise en ce que les ressources 
40 comprennent des ressources accessibles par un reseau tel que PInternet. 
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19. Procede selon la revendication 16, caracterise en ce que 1' identification d'une ressource 
donnde est obtenue par un processus d' identification de ressources similaires ou pertinentes par 
rapport k au moins une ressource de depart. 

20. Procede selon la revendication 16 ou 19, caracterise en ce que, dans le cas ou la lecture de 
5 la memoire de gestion associative determine F existence de plusieurs ressources associees, Petape 

de signalisation comprend la signalisation ordonn^e d'au moins une partie desdites plusieurs 
ressources associ6es. 

21. Procede selon la revendication 20, caracterise en ce que la signalisation ordonn^e est 
bas^e sur la determination de scores de pertinence desdites ressources associees. 

10 22. Procede selon l'une des revendications 14 k 21, caracterise en ce que la memoire de 
gestion associative de ressources est contenue dans un serveur accessible a partir d'une plurality 
de postes individuels dans lesquels l'etape de d^placement peut etre mise en oeuvre. 

23. Procede selon la revendication 22, caracterise en ce <jue les associations entre ressources 
sont memorisees utilisateur par utilisateur. 

15 24. Procede selon la revendication 22, caracterise en ce que les associations entre ressources 
sont memorisees de fa?on mutualis£e entre plusieurs utilisateurs. 

25. Procede pour identifier a partir d'une ressource de texte, une partie de ladite ressource 
susceptible de constituer une requete significative pour un moteur de recherche, caracterise en ce 
qu'il comprend les etapes suivantes : 

20 - oter du texte les mots non significatifs ; 

- etablir et completer une memoire de liens entre parties dudit texte, ou une partie est Iiee a une 
autre quand elle contient au moins un mot significatif en commun ; 

- mettre en oeuvre un procede de determination de scores de ressources par analyse d'un graphe 
de nceuds de ressources relies par des liens, ou chaque ressource utilisee dans ce procede est 

25 constituee par une partie du texte, sur les parties de texte ainsi liees entre elles ; 

- utiliser au moins Tune des parties de texte constituees par les ressources candidates determinees 
par ledit procede comme texte de requete ou comme base pour un texte de requete. 

26. Procede selon la revendication 25, caracterise en ce que Petape de mise en oeuvre du 
procede selon l'une des revendications 1 a 4 est effectuee seulement avec des parties de texte 

30 selectionnees comme preponderates, oil les parties de texte citantes sont les parties de texte qui 
comprenant au moins un mot en commun avec la ou les parties de texte preponderates, ou un 
lien est cree k partir de chaque partie de texte citante vers la ou les parties de texte 
preponderates, ou les parties de texte contenant au moins un mot egalement contenu dans les 
parties de texte citantes sont identifiees, pour former un groupe de parties de texte co-citees, et oik 

35 est temporairement cree un lien a partir de chaque partie de texte citante vers chaque partie de 
texte co-citee avec laquelle ladite partie de texte citante possfcde au moins un mot en commun. 

27. Procede selon l'une des revendications 25 et 26, caracterise en ce que les parties de texte 
sont des phrases. 

28. Procede de gestion de ressources d' information telles que des pages Web dans un 
40 systeme informatique comprenant un poste utilisateur dote d'un ecran d'affichage, chaque 

ressource possedant un identifiant (URI) permettant son accds a partir du poste utilisateur, 
procede caracterise en ce qu'il comprend les etapes suivantes : 
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(a) declaration par Putilisateur d'une association entre deux ressources, en associant k une 
deuxieme ressource P identificateur d'une premiere ressource ; 

(b) identification d' autres ressources pertinentes par rapport k la deuxieme ressource ; et 

(c) lors de l'acc&s a Tune des autres ressources (page courante), signalisation de 
5 Pexistence de la premiere ressource. 

29. Precede selon la revendication 28, caracterise en ce que Petape (b) comprend la selection 
d'autres ressources les plus pertinentes pour la mise en oeuvre de Petape (c). 

30. Precede selon Tune des revendications 28 et 29, caracterise en ce que Petape (a) est mise 
en oeuvre pour une plurality de deuxtemes ressources appartenant a un groupe, et en ce que 

10 Petape (b) comprend 1' identification d'autres ressources pertinentes par rapport a P ensemble des 
deuxi&mes ressources du groupe. 

31. Precede selon Tune des revendications 28 a 30, caracterise en ce que Petape (b) est 
declench6e par la realisation de Petape (a). 

32. Precede selon Tune des revendications 28 a 30, caracterise en ce que Petape (b) est mise 
15 en oeuvre posterieurement a Pacees pr6vu a Petape (c) pour determiner si P autre ressource a 

laquelle il a 6t6 accede est une autre ressource pertinente par rapport a la deuxieme ressource. 

33. Proc^de selon Tune des revendications 28 a 30, caracterise en ce que Petape (b) est mise 
en oeuvre par fourniture d'un identificateur de la deuxieme ressource a un serveur de 
determination de ressources pertinentes. 

20 34. Precede selon Pune des revendications 28 a 33, caracterise en ce que Petape (b) est mise 
en oeuvre par identification d'autres ressources pertinentes par rapport a au moins une ressource 
interm&iiaire (spot) par rapport a laquelle la deuxieme ressource est pred6termin£e comme etant 
pertinente. 

35. Precede selon Pune des revendications 28 a 34, caracterise en ce qu'il comprend en outre 
25 Paffichage, au voisinage d'une zone d'affichage de ressources, de representations de liens vers 

au moins certaines parmi les premieres ressources, les ressources interm6diaires, et des 
ressources pertinentes par rapport aux ressources intermediaires. 

36. Precede selon Pune des revendications 28 k 35, caracterise en ce que Petape (a) est mise 
en ceuvre par action a Paide d'un dispositif d'entree sur des objets graphiques representatifs des 

30 premiere et deuxieme ressources. 

37. Precede pour identifier des ressources d' informations accessibies par liens (telles que des 
pages Web) recentes, pertinentes par rapport k au moins une ressource donnee, caracterise en ce 
qu'il comprend les etapes suivantes : 

- appliquer une requSte comprenant un identificateur de ladite ressource donnee k un systeme de 
35 determination de pertinence entre ressources, 

- seiectionner un premier ensemble de ressources les plus pertinentes (e.g. meilleurs scores 
pivots) par rapport a ladite ressource donnee, 

- rechercher, dans chacune des ressources les plus pertinentes, des regions possedant des liens 
vers d' autres ressources de pertinence eievee en moyenne, dites regions pertinentes, 

40 - surveiller P apparition, dans lesdites regions pertinentes, de nouveaux liens qui pointent vers des 
ressources qui n'etaient pas encore connues du systeme, dites nouvelles ressources, 
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- s61ectionner un deuxieme ensemble de ressources ayant une pertinence elev^e (e.g. meilleurs 
scores autorite hypertexte) par rapport k ladite ressource donnee, 

- sdlectionner les nouveiles ressources qui ont une similarity de contenu la plus 61ev6e par rapport 
aux ressources dudit deuxifeme ensemble de ressources et donner aux nouveiles ressources 

5 selectionn6es un niveau de pertinence (score autorite de similarite) dependant du temps en 
fonction de ladite similarity de contenu. 

37. Procede pour permettre faeces par un utilisateur k des d'entites d' informations 
pertinentes a partir d'une entite dMnformations de depart, chaque entite d' informations etant 
accessible par un identifiant (URI), caractyrisy en ce qu'il comprend les Stapes suivantes : 

10 a) pr6voir au moins une entite dMnformations similaire, presentant un contenu similaire k ceiui de 
P entite de depart, et determiner Pidentifiant de la ou de chaque entite dMnformations similaire, et 

b) determiner & partir du ou de chaque identifiant d' entity dMnformations similaire un ensemble 
d'un ou plusieurs identifiants d'entites dMnformations pertinentes par rapport k la ou chaque 
entity dMnformations similaire. 

15 39. Procedy selon la revendication 38, caracterise en ce quMl comprend en outre P etape 
suivante : 

c) permettre a Tutilisateur Pacces a au moins certaines informations pertinentes a partir de leurs 
identifiants respectifs. 

40. Procedy selon la revendication 38 ou 39, caracterise en ce quMl comprend en outre Petape 
20 suivante : 

d) a partir des identifiants d'entites dMnformations pertinentes et d'un ensemble donny d'entites 
dMnformations suppiymentaires, selectionner les entites supplementaires les plus similaires aux 
entites dMnformations pertinentes. 

41. Procyde selon Tune des revendications 38 £ 40, caractyrise en ce qu'il comprend une 
etape supplementaire de tri des entitys dMnformations pertinentes par degre de pertinence. 

42. Procede selon la revendication 41, caractyrise en ce que 1'ytape de tri est prycedee d'une 
etape de calcul d'un score de pertinence par rapport a la ou chaque entite dMnformations 
similaires pour chacune des entitys dMnformations pertinentes. 

43. Procedy selon I 'une des revendications 38 h 42, caracterise en ce que chaque entity 
dMnformations est constituye par un fragment de page ecrite en langage de marquage normalisy, 
ou par une telle page dans son ensemble. 

44. Procyde selon la revendication 43, caracterisy en ce que chaque identifiant est constituy 
par un identificateur uniforme de ressource (URI) du fragment ou de la page. 

45. Procydy selon 1'une des revendications 38 k 44, caractyrisy en ce que l'etape a) est 
ryalisee par syiection par Putilisateur d'une ou plusieurs entitys dMnformations similaires k 
V entite dMnformations de dypart. 

46. Procede selon l'une des revendications 38 a 44, caractyrisy en ce que 1'ytape a) est 
realisee par mise en oeuvre d'un processus de dytermination automatique d'entites dMnformations 
similaires. 

40 47. Procede selon Pune des revendications 38 k 44, caracterisy en ce que 1'ytape a) est 
realisee par mise en oeuvre d'un processus de dytermination automatique d'entites dMnformations 
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similaires, suivie d'une selection par Putilisateur d'une ou plusieurs entites d'informations 
similaires parmi les entites d' informations similaires determines par ledit processus. 

48. Procede selon Pune des revendications 38 a 47, caracterise en ce que Tetape b) est 
r£alis6e par mise en ceuvre d'un processus de determination automatique d'entites d' informations 

5 pertinentes. 

49. Procede selon la revendication 48, caracterise en ce que le processus de determination 
automatique d'entites d' informations pertinentes comprend P analyse d'une structure de graphe 
d' identifiants constitute par les identifiants d'entites d' informations et par les identifiants 
dtsignes par des liens activables par Putilisateur contenus dans lesdites entites d 3 informations. 

10 50. Procede pour determiner des scores de pertinence d' unites de texte telles que des phrases 
dans un document textuel, caracterise en ce qu'il comprend les etapes suivantes : 

- decomposition du document en une pluralite d'unites de texte, 

- selection d'au moins une unite de texte pertinente et d'unites de texte candidates, 

- determination dePensemble des mots signifiants contenus dans 1 'unite (ou les unites) de 
1 S texte pertinente(s) et dans chacune des unites de texte candidates, 

- pour chaque mot signifiant contenu dans 1' unite (ou les unites) de texte pertinente(s), 
identification des unites de texte candidates citant ce mot signifiant, pour former un groupe 
d'unites de texte citantes, 

- identification des unites de texte candidates contenant au moins un mot signifiant 
20 egalement cite dans les unites de texte citantes, pour former un groupe d'unites de texte co- 

citees, 

- affectation aux unites de texte co-citees un score de pertinence en fonction desdites 
citations. 

25 51. Procede pour determiner des scores de pertinence d'unites de texte telles que des phrases 
dans un document textuel, caracterise en ce qu'il comprend les etapes suivantes : 

- decomposition du document en une pluralite d'unites de texte, 

- selection d'au moins une unite de texte pertinente et d'unites de texte candidates, 

- determination de 1'ensemble des mots signifiants contenus dans Punite (ou les unites) de 
30 texte pertinente(s) et dans chacune des unites de texte candidates, 

- pour chaque mot signifiant contenu dans Punite (ou les unites) de texte pertinente(s), 
identification des unites de texte candidates comprenant ce mot signifiant, pour former un groupe 
d'unites de texte cites, 

- identification des unites de texte candidates contenant au moins un mot signifiant 
35 egalement cite dans les unites de texte cites, pour former un groupe d'unites de texte co-citantes, 

- affectation aux unites de texte co-citantes un score de pertinence en fonction desdites 
citations. 

52. Procede pour determiner des scores attribues k des mots ou groupes de mots contenus 
dans des unites de texte telles que des phrases dans un document textuel, caracterise en ce qu'il 
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comprend une etape qui consiste k additionner les scores de pertinences, determines selon Tune 
des revendications 50 et 51, des unites de texte dans lesquels lesdits mots se trouvent. 
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